Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel...

45
10.1 10.2 10.3 10.4 10.1 INTRODUCCION MODELO DE REGRESION LINEAL MlTLTlPLE OBTENCION DE LA ECUACION DE REGRESION MULTIPLE 10.5 10.6 10.7 USO DE LA ECUACION DE REGRESION MULTIPLE MODELO DE CORRELACION MULTIPLE RESUMEN EVALUACION DE LA ECUACION DE REGRESION MULTIPLE , INTRODUCCION En el capitulo 9 se estudian los conceptos y ttknicas para analizar y utilizar la relaci6n lineal entre dos variables. Este amHisis puede conducir a una ecuaci6n que puede utilizarse para predecir el valor de alguna variable dependiente dado el valor de una variable independiente asociada. . La intuici6n sefiala que, e:n debe existir la posibilidad de mejorar la capacidad de predicci6n al induir mas variables independientes en dicha ecuaci6n. Par ejemplo, un investigador encuentra que las calificaciones de la inteligencia de las personas pueden predecirse a partir de facto res fisicos como el orden de nacimiento, el peso al nacer y la duraci6n de la gestaci6n, junto con ciertos factores hereditarios y ambientales. La permanencia de una persona en un hospital de enfermedades cr6nicas puede depender de la edad del paciente,estado civil, sexo e ingresos, ademas del factor obvio del diagn6stico. La respuesta de un animal de laboratorio a algCin f:irmaco puede depender de la dosis y de la edad y del peso del animal. Una enfermerasupervisora tal vez desee saber la intensidad de la relaci6n entre la eficiencia de una enfermera en el trabajo, su calificaci6n en el examen de la direcci6n estatal, sus antecedentes escolares y su calificaci6n en alguna proeba de . habilidad 0 aptitud; 0 bien, es posible que eladministrador de un hospital, al estudi;ir las admisiones de diversas comunidades a las que atiende el hospital, desee determinar factores parecen ser los que influyen en las diferencias observadas en las tasas de admisi6n. 474

Transcript of Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel...

Page 1: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

101

102

103

104

101

INTRODUCCION

MODELO DE REGRESION LINEAL MlTLTlPLE

OBTENCION DE LA ECUACION DE REGRESION MULTIPLE

105

106

107

USO DE LA ECUACION DE REGRESION MULTIPLE

MODELO DE CORRELACION MULTIPLE

RESUMEN

EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE

INTRODUCCION

En el capitulo 9 se estudian los conceptos y ttknicas para analizar y utilizar la relaci6n lineal entre dos variables Este amHisis puede conducir a una ecuaci6n que puede utilizarse para predecir el valor de alguna variable dependiente dado el valor de una variable independiente asociada

La intuici6n sefiala que en gei1~ral debe existir la posibilidad de mejorar la capacidad de predicci6n al induir mas variables independientes en dicha ecuaci6n Par ejemplo un investigador encuentra que las calificaciones de la inteligencia de las personas pueden predecirse a partir de facto res fisicos como el orden de nacimiento el peso al nacer y la duraci6n de la gestaci6n junto con ciertos factores hereditarios y ambientales La permanencia de una persona en un hospital de enfermedades cr6nicas puede depender de la edad del pacienteestado civil sexo e ingresos ademas del factor obvio del diagn6stico La respuesta de un animal de laboratorio a algCin firmaco puede depender de la dosis y de la edad y del peso del animal Una enfermerasupervisora tal vez desee saber la intensidad de la relaci6n entre la eficiencia de una enfermera en el trabajo su calificaci6n en el examen de la direcci6n estatal sus antecedentes escolares y su calificaci6n en alguna proeba de

habilidad 0 aptitud 0 bien es posible que eladministrador de un hospital al estudiir las admisiones de diversas comunidades a las que atiende el hospital desee determinar qw~ factores parecen ser los que influyen en las diferencias observadas en las tasas de admisi6n

474

475 102 MODELO DE REGRESION LINEAL MULTIPLE

Los conceptos y tecnicas para elamilisis de asodacion entre diversas variables son extensiones naturales de las variables estudiadas en los capitulos anterioresLos caIculos como se pudiera esperar son mas complejos y laboriosos Sin embargo tal como se mendona en el capitulo 9 esto no representa realmente un problema cuando se dispone de una computadora No es raro encontrar investigadores que estudian las relaciones existentes en una docena de variables 0 mas Para aquellos que tienen acceso a una computadora la decision de cuantas variables incluir en un anaIisis se basa no en la complejidad y cantidad de los cilculos sino en consideradones de su significado el costo de inclusion y la importanda de su contribucion

En este capitulo se sigue estrictamente la secuencia del capitulo 8 Primero se estudia el modelo deregresion seguido por un anaIisis del modelo de correlacion AI considerar el modelo de regresion se cubren los siguientes puntos una descripcion del modelo los metodos para obtener la ecuacion de regresion la evaluacion de la ecuacion y los usos que pueden hacerse de ella En ambos modelos se estudian los procedimientos inferendales y sus suposiciones fundamentales

102 MODELO DE REGRESION LINEAL MULTIPLE

En el modelo de regresion multiple se supone que existe una relacion lineal entre alguna variable Y ala cual se Ie da el nombre de variable dependiente y k variables independientes Xl X 2 Xkbull A veces a las variables independientes se les llama variables explicativas porque se utilizan para explicar la variacion en Y Tambien se les conoce como variables de predicci6n pues se usan para predecir a Y

Supuestos (restricciones) Las suposiciones en las que se basa el analisis de regresion multiple son las siguientes

1 Las Xi son variables no aleatorias (fUas) Esta suposicion distingue al modelo de regresion multiple del modelo de correlacion multiple el cual se estudia en la seccion 106 Esta condicion indica que cualquier inferencia que se haga de los datos de la muestra solo se aplica al con junto de valores de X observados y no para alg11n conjunto mayor de valores de X Bajo el modelo de regresion el anaIisis de correladon carece de significado Bajo el modelo de correladon que se estudia mas adelante pueden aplicarse las tecnicas de reshygresion que siguen

2 Para cada conjunto de Xi valores existe una subpoblacion de valores de Y Para construir algunos intervalos de confianza y probar hipotesis se debe saber 0

el investigador debe inclinarse a suponer que estas subpobladones de valores de Y siguen una distribucion normal Puesto que se pretende demostrar estos procedimientos de inferencia se supondra que los datos de los ejemplos y ejercicios de estecapitulo presentan unadistribucion normal

476 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

3 Las variancias de las subpoblaciones de Y son todasiguales

4 Los valores de Y son independientes Esto es los valores de Y seleccionados para un conjunto de valores de X no dependen de los valores de Y seleccionashydos en otto conjuntode valores de X

Ecuucion del modelo Estas suposiciones para el analisis de regresi6n multishyple pueden enunciarseen forma mas concretacomo

(1021)

donde Yj es un valor representativo de una de las subpoblaciones de los valores de Y las ~i son los coeficientes de regresi6n las xl X2 bullbullbull xk son respectivamente los

valores especfficos de las variables independie6teXl X Xp yej es una variable aleatoria con media 0 y variancia 02 la variancia comun a las subpoblaciones de los

valores de Y Para construir intervalos de confianza para los coeficientes de regreshysi6n y probar las hip6tesis se supone que los valores de ej siguen una distribuci6n normal independiente Las afirmaciones referentes a ej son consecuencia de las suposiciones respecto a las distribuciones de los valores de Y Ala ecuaci6n 1021 se Ie conoce como el modelo de regresion lineal multiple

Cuando la ecuaci6n 1021 consta de una variable dependiente y dos variables independientes es decir cuando el modelo se escribe como

Yj ~o + ~JXlj + ~2X2j +e j (1022)

puede ajustarse un plano en el espacio tridimensional a los puntos de los datos tal como se muestra en la figura 1021 Cuando el modelo contiene mas de dos variashybles independientes se describe geometricamente comoun hiperplano

y

it f

it

x

FIGURA 1021 Planoy dispersi6n depuntos de la regresi6n multiple

477 103 OBTENCION DE LA ECUACION DE REGRESION MUITIPLE

En la figura 1021 es posible visualizar algunos de los puntos arriba del plano y otros abajo La desviacion de un punto a partir del plano se representa con la siguiente ecuaci6n

(1023)

En la ecuacion 1022 ~o representa el punto donde el plano corta al eje Y es decir representa la interseccion del plano con Y ~1 mide el cambio promedio en Y por unidad de cambio en XI cuando X2 permanece sin cambio y ~2mide el cambio promedio en Y par unidad de cambio en X2 cuand() XI permanece sin cambio Por esta razon ~I y ~2 son los coeficientes de regresi6n parcial

103 OBm~CION DE IA ECUACION DEREGRESION MULTIPLE

Las estimaciones insesgadas de los parametros ~o ~I bullbullbull ~k del modelo especificado en la ecuacion 1021 se obtienen mediante el metodo de los mfnimos ruadrados Esto significa que se minimiza la suma de las dcsviaciones elevadas al cuadrado de los valores observados de Y respecto dela superficie de regresion resultante En el caso de tres variables como se muestraen la figura 1021 la suma de las desviacioshynes al cuadrado de las observaciones respecto del plano es un minimo cuando se estiman ~o ~IY~2 por el metodode mfnimos ruadrados En otras palabras se seleccionan estimaciones de ~o ~J bullbullbull ~k de la muestra en tal forma que la cantidad

es minimizada Esta cantidad que es la suma de los cuadrados residuales tambien puede escribirse como

(1031)

para indicar el hecho de quese minimiza la suma de cuadrados de las desviaciones de los val ores observados dey respecto de los valores de esta variable calculados a partir de la ecuacion estimada

Las estimaciones de los panimetros de regresion multiple se pueden obtener mediante calculos aritmeticoshechos con una calculadora de bolsillo Este metodo para obtener las estimaciones es laborioso consume tiempo esta sujeta a errores y es una perdida de tiempo cuando se dispone de una computadora Aquellos que esten interesados en analizar 0 utilizar el metodo aritmetico pueden consultar las primeras ediciones de este libro 0 las obras de Snedecor y Cochran (1) Y Steel y Torrie (2) quienes ofrecen ejemplosnumericos para cuatro variables Anderson y Bancroft (3) muestran los caIculos involucrados ruando existen cinco variables En el siguiente ejemplo se utilizo el paquete MINITAB para mostrar la aplicacion del analisis de regresion Illultiple

478 CAPiTuLO 10 REGRESION Y CORRELACION MULTIPLE

FJEMPLO 1031

Kalow y Tang (A-I) condujeron un estudio para establecer la variaci6n de las actividades del citocromo P-450IA2 determinada mediante la cafeina en una poshyblaci6n de voluntarios sanos EI segundo objetivo del estudio era comparar la variaci6n en fumadores contra la mayorfa de no fumadores de la poblaci6n Los individuos respondieron a los carteles colocados en el edificio de ciencias medishycas de unauniversidad Las variables sobre las que el investigador recolect6 datos fueron 1)- indice deP-450IA2 (Indice IA2) 2) numero de cigarros fumados por dia (Cigdfa) y 3) nivel de cotihina urinaria (Cot) Las mediciones de estas tres variables para 19 individuos semuestran en la tabla 1031 Se pretende obtener la ecuaci6n de regresi6n multiple

Soluci6n Se ingresan las observaciones de las variables Cigldfa Cot e Indice IA2 en cl c2 y c3 y se les nombra Xl X2 Y Y respectivamente La caja de dialoshygo MINITAB el comando de la sesi6n y lasalida se muestra en la figura

TABlA 1031 Ntimero de cigarros fumados por dia nivel de cotinina urinaria e indice de P~450IA2para

19 individuos descritos en el ejemplo 1031

Cigdia Cot Indice 1A2

1 0000 41648 1 0000 37314 1 0000 57481 1 0000 44370 1 0000 64687 3 0000 38923 8 105950 52952 8 46154 46031 8 271902 58112 8 55319 36890 8 27778 33722

10 197856 80213 10 228045 108367 15 0000 41148 15 145193 55429 15 367113 113531 20 212267 75637 20 211273 72158 24 632125 135000

FUENTE UtiIizada con autorizaci6n de Werner Kalow

419 103 OBTENCION DE LA ECUACIONDE REGRESION MULTIPLE

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Regression MTB gt Name C4 SRES1 Teclear Yen Response y Xl X2 CS = FITS1 C6 = RESI1 en Predictors MTB gt Regress y 2 xl x2 Verificar Residuals SUBCgt SResiduals SRES1 i Verificar Standard resids SUBCgt Fits FITS1 ClicOK SUBCgt Constant

SUBCgt Residuals RESI1

Resultados

Regression Analysis The regression equation is y = 452 00517 xl + 0170 x2

Predictor Coef Stdev t-ratio p Constant 45234 05381 841 0000 xl -005169 006950 074 0468 x2 017020 003013 565 0000

s 1390 R-sq =793 R-sq(adj) = 767

Analysis of Variance

SOURCE DF SS MS F P Regression 2 118060 59030 3056 0000 Error 16 30911 1932 Total 18 148971

SOURCE DF SEQ SS xl 1 56403 x2 1 61658

Unusual Observationns Obs xl y Fit StdevFit Residual StResid

9 80 5 811 8738 0589 -2926 -232R 13 100 10837 7888 0409 2949 222R 19 240 13500 14042 1043 -0542 -059X

R denotes an obs with a large st resid X denotes an obs whose X value gives it large influence

FIGURA 1031 Procedimiento MINITAB Y resultados para el ejemplo 103 L

480 CAPITULO 10 REGRESION Y CQRRELACION MULTIPLE

Sistema SAS

Model MODELl Dependent Variable IA2

Analysis of variance

Sum of Mean

Source DF Squares Square F Value ProbgtF

Model 2 11806041 5903020 30555 00001 Error 16 3091080 1 93192

C Total 18 14897121

Root MSE 1 38994 R-square 07925 Dep Mean 628217 Adj R-sq 07666 CV 2212510

Parameter Estimates

Parameter Standard T for HO Variable DF Estimate Error Parameter=O Prob gt ITI

INTERCEP 1 4523383 053806674 8407 00001

COT 1 0170201 003012742 5649 00001 CIGDAY 1 -0051693 006950225 0744 04678

FIGURA 1032 Resultados producidos por el paquete SASreg para el ejemplo 1031

1031 A partir de los resultados se observa que la ecuaci6n de regresi6n multiple en la notaci6n de la secci6n 102 es

y = 45234-05169x1j +17020x2j

En las secciones siguientes se estudian otros ejemplos En la figura 1032 se muestran los resultados del paquete SAS

para el ejemplo 1031 bull

Despues de obtener la ecuaci6n de regresi6n multiple el siguiente paso es evaluar e interpretar En la siguiente secci6n se cubre esta faceta del amHisis

EJERCICIOS 481

FJERCICIOS

Obtenga la ecuaci6n de regresi6n para cada uno de los siguientes con juntos de datos

1031 Los individuos estudiados por Malec et al (A-2) fueron 16 graduados de un programa inteshygral de rehabilitaci6n de lesiones cerebrales postagudas Los investigadores examinaron las relaciones entre diversas variables que induian el resultado de trabajo (la escala iba de I para desempleado hasta 5 que representa empleo competitivo sin prestaciones) la calificaci6n al momento de la evaluaci6n inicial sobre el inventario de adaptabilidad Portland (PAl por sus siglas en Ingles) y el tiempo de permanencia en dfas Las mediciones registradas sobre estas tres variables son las siguientes

y XI

Resultado Tiempode x2 del permanencia PAl trabajo (dias) PRE

5 67 19 4 157 17 2 242 23 4 255 14 1 227 27 4 140 22 1 179 23 4 258 18 4 85 16 5 52 22 3 296 15 1 256 30 4 198 21 1 224 22 4 126 19 4 156 8

FUENn Utilizada con autorizaci6n deJames Malec PhD

1032 David y Riley (A-3) examinaron los factores cognoscitivos medidos con la prueba de nivel cognoscitivo de Allen (ACL por sus siglas en Ingles) y la relaci6n de la prueba con el nive de psicopatologfa Los individuos estudiados eran pacientes de la unidad de psiquiatrfa del Hospital GeneraL Entre las variables sobre las que trabajaron los investigadores ademas del ACL estaban las calificaciones sobre el vocabulario (V) y la abstracci6n (A) componenshytes del Instituto Shipley de la escala de vida y las calificaciones sobre la prueba de modalishydades de simbologia digital (PMSD) Se registraron las siguientes mediciones en 69 pacientes La variable dependiente es ACL

Individuo ACL PMSD V A

432 CAPITULO 10 REGRESI6N Y CORRELACI6N MULTIPLE

Individuo ACL PMSD V A

1 60 70 2 54 49 3 47 28 4 48 47 5 49 29 6 45 23 7 63 40 8 59 50 9 41 32

10 48 27 11 40 33 12 45 40 13 58 66 14 60 46 15 45 26 16 47 42

28 34 19 32 22 24 24 18 31 14 24 34 29 27 15 31

36 32 8

28 4

24 12 14 20

8 8

36 20 34 10 24

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

59 47 47 38 60 56 48 58 45 48 47 45 60 56 63 52

42 52 35 41 58 41 13 62 46 52 63 42 66 55 55 43

30 17 26 18 32 19 14 27 21 26 22 22 30 26 22 22

26 26 28 26 16 10 36 20 28 14 26 26 26 28 28

Individuo ACL PMSD V A

10 36 30 16 8 2

32 36 18 18 20 8

30 6 6 8 6 8

22 FUENTE Utilizada con autorizaci6n de Sandra K David OTRL

1033 En un estudio acerca de la percepcion de los posibles facto res relacionados con los patrones de admision en un gran hospital un administrador obtuvo estos datos a partir de 10 comushynidades dentro del area de captacion del hospital

16 32 26 11 18 14 30 30 31 23 28 17 31 12 18 23 22 13 30

Individuo ACL PMSD V A

52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

45 49 42 45 48 60 40 45 40 47 60 45 48 66 41 45 66 49

33 48 34 58 35 48 36 37 37 45 38 49 39 50 40 39 41 37 42 56 43 48 44 56 45 66 46 43 47 40 48 42 49 56 50 34 51 40

48 47 50 29 17 39 31 61 45 56 53 29 63 19 23 40 20

2 41

44 51 37 56 37 76 42 20 48 54 53 39 35 63 17 44 47 35

29 28 20 32 33 26 26 13 27 40 25 20 26 26 16 31 30 10

24 36 8

36 36 20 8

10 16 40 32

8 10 30 16 24 36 19

EJERCICIOS 483

Personas por cada 1000 Indice de disponibilidad internadas durante el de otros servicios de Indice de

periodo de estudio salud indigencia Comunidad (Y) (Xl) (X2)

1 616 60 63 2 532 44 55 3 655 91 36 4 649 81 58 5 727 97 68 6 522 48 79 7 502 76 42 8 440 44 60 9 538 91 28 10 535 67 67

Total 5716 699 556

1034 El administrador de un hospital general obtuvo los siguientes datos de 20 pacientes interveshynidos quirurgicamente durante un estudio para determinar que factores parecen estar relashycionados con eI tiempo de hospitalizacion

Tiempo de permanencia Numero de problemas Tiempo de permanencia posoperatoria en dias (Y) medicos actualmente (Xl) preoperatoria en dias (X2)

6 1 1 6 2 1

11 2 2 9 1 3

16 3 3 16 1 5 4 1 1 8 3 1

11 2 2 13 3 2 13 1 4 9 1 2

17 3 3 17 2 4 12 4 1 6 1 1 5 1 1

12 3 2 8 1 2 9 2 2

Total 208 38 43

484 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

1035 Una muestra aleatoria de 25 enfermeras seleccionadas de un directorio de enfermeras generales produjo la siguiente informaci6n respecto a la calificaci6n del examen de colocaci6n de cada una de elIas realizado por la direcci6n estatal de personal (en Estados Unidos) y la calificaci6n final de graduaci6n escolar Ambas calificaciones se relacionan con el area de afiliaci6n de las enfermeras Ademas se tuvo informaci6n de las calificaciones obtenidas por cada enfermera en una prueba de aptitud realizada al ingresar a la escuela de enfermeria Los datos completos son los siguientes

Calificaci6n de aprobaci6n Calificaci6n de la por el estado (Y) Calificaci6n final (Xl) prueba de aptitud (X

2)

440 87 92 480 87 79 535 87 99 460 88 91 525 88 84 480 89 71 510 89 78 530 89 78 545 89 71 600 89 76 495 90 89 545 90 90 575 90 73 525 91 71 575 91 81 600 91 84 490 92 70 510 92 85 575 92 71 540 93 76 595 93 90 525 94 94 545 94 94 600 94 93 625 94 73

Total 13425 2263 2053

1036 Se registraron los siguientes datos para una muestra aleatoria simple de 20 pacientes con hipertensi6n Las variables son

Y presi6n arterial sanguinea media (mm Hg)

XI edad (en afios)

X2 peso (kg)

X3 = area de la superficie corporal (m2)

X4

duraci6n de la hipertensi6n (afios)

X5 pulso basico (latidosmin)

X6 medici6n del estres

104 EVAIUACION DE LA ECUACION DE REGRESION MULTIPLE 485

Paciente Y Xl X2 X3 X4 X5 X6

1 105 47 854 175 51 63 33 2 115 49 942 210 38 70 14 3 116 49 953 198 82 72 10 4 117 50 947 201 58 73 99 5 112 51 894 189 70 72 95 6 121 48 995 225 93 71 10 7 121 49 998 225 25 69 42 8 110 47 909 190 62 66 8 9 110 49 892 183 71 69 62

10 114 48 927 207 56 64 35 11 114 47 944 207 53 74 90 12 115 49 941 198 56 71 21 13 114 50 916 205 102 68 47 14 106 45 871 192 56 67 80 15 125 52 1013 219 100 76 98 16 114 46 945 198 74 69 95 17 106 46 870 187 36 62 18 18 113 46 945 190 43 70 12 19 110 48 905 188 90 71 99 20 122 56 957 209 70 75 99

104 EVALUACION DE L ECUACION DE REGRESION MULTIPLE

Antes de utilizar una ecuaci6n de regresi6n multiple para predicci6n y estimaci6n es conveniente determinar primero si de hecho vale la pena utilizarla AI estudiar la regresi6n lineal simple se aprendi6 que puede evaluarse la utili dad de una ecuaci6n de regresi6n considerando el coeficiente de determinaci6n de la muestra y la penshydiente estimada AI evaluar la ecuaci6n de regresi6n multiple la atenci6n se centra en el coeficiente de determinaci6n multiple y los coeficientes de regresi6n parciales

El coeficiente de determinacion mUltiple En el capitulo 9 se estudia con detalle el coeficiente de determinaci6n El concepto se extiende 16gicamente al caso de la regresi6n multiple La variacion total presente en los valores de Y puede dividirshyse en dos componentes la variaci6n explicada que mide la cantidad de la variaci6n total que es explicada por la superficie de regresi6n ajustada y la variaci6n inexplicashyda que es aquella parte de la variaci6n total que no es explicada por el ajuste de la superficie de regresion La medida de la variaci6n en cada caso es una suma de desshyviaciones elevadas al cuadrado La variaci6n total es la surna de desviaciones al cuashydrado de cada observaci6n de Ya partir de la media de las observaciones y se designa por 2(Yj - y)2 0 SC

tata] La variaci6n explicada designada por 2(yj )1)2 es la surna

de las desviaciones al cuadrado de los valores calculados a partir de la media de los val ores de Y observados Esta suma de desviaciones al cuadrado es la suma de cuadrashy

486 CAPITULO 10 REGRESIONY CORRELACION MULTIPLE

dos debida a la regresi6n (SCR) La variacion inexplicada escrita como 2(Yj y)2es la

suma de las desviaciones al cuadrado de las observaciones originales a partir de los valores calculados A esta cantidad se Ie conoce tambien como la suma de cuadrados en torno a la regresiOn 0 la suma del cuadrado de los errores (SCE) Se puede resumir la relashycion entre las tres sumas de cuadrados con la siguiente ecuacion

L(Yj W L(Yj - W + L(Yj - Yj)2 (1041)

SCwtal = SCR + SCE

suma total de cuadrados = suma de cuadrados explicados (debido a la regresion) + suma de cuadrados no explicados (de los errores)

El coeficiente de determinacion multiple R12 k se obtiene al dividir la suma de cuadrados explicados entre la suma total de cuadrados Esto es

R2 = L(Yj - y)2 (1042)y12 L(Yj _ y)2

El subindice y12 k nos seiiala que en el analisis Yes tratada como variable dependiente y que las variables desde Xl hasta X

k son tratadas como variables indeshy

pendientes EI valor de R12k indica que proporcion del total de variacion en los valores de Y observados es explicada por la regresion de Y sobre XI X

2 bull bull X En

otras palabras se dice que R12 k es una medida de bondad de ajuste de la superfishycie de regresion Esta cantidad es analoga a r2 calculada en el capitulo 9

FJEMPLO 1041

Con suite el ejercicio 1031 Ycalcule R12

Solndon Para el ejemplo se tiene en la figura 1031 que

SC = 1489671total

SCR = 118060 SCE 30911

R212 = 118060 = 7925 7930 y 148971

Se puede decir que aproximadamente 793 por ciento del total de la variacion en los valores de Y se explica a traves del plano de regresion ajustado es decir a traves de la relacion lineal con Xl y X2bull bull

Prueba de hip6tesis de ta regresi6n Para determinar si la regresion comshypleta es significativa (es decir para determinar si R212 es trascendente) se puede aplicar la prueba de hipotesis como sigue Y

1 Datos La situacion de la investigacion y los datos generados por el investishygador se examinan para determinar si la regresion multiple es una tecnica

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 487

TABlA 1041 Tabla NOVA para la regresion multiple

Fuente SC gl CM Rv

Debido a la regresi6n Respecto a la regresi6n

SCR SCE

k n-k-l

CMR SCRk CME = SCE(n-k-l)

CMRCME

Total SCtotal

n 1

2 Supuestos Se considera que el modelo de regresi6n multiple y las suposishyciones basicas tal como se presentan en la secci6n 102 son ap1icables

3 Hipotesis En general la hip6tesis nula es Ho P = P == P = Ph 0 y l 2 3 la hip6tesis alternativa es H

A no todas las Pi = O En palabras la hip6tesis nula

afrrma que todas las variables independientes carecen de valor para explicar la variaci6n enlos valores de Y

4 Estadistica de prueba La estadfstica de prueba conveniente es RY que se calcula como parte del analisis de la variancia La tabla AN OVA se muestra en la tabla 10041 En la tabla 10041 CMR simboliza el cuadrado medio debido a la regresi6n y CME simboliza el cuadrado medio respecto a la regresi6n 0

como algunas veces se Ie llama el cuadrado medio del error

5 Distribuci6n de la estadistica de prueba Cuando Ho es verdadera y se cumshyplen las suposiciones RY sigue una distribuci6n F con k y n - k - 1 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de RY es mayor 0

igual que el valor cdtico de F

7 Ca1cular la estadfstica de prueba Vease la tabla 1004 I

8 Decision estadistica Se rechaza 0 no se rechaza Ho de acuerdo con la regIa de decisi6n

9 Conclusion Si se rechaza Ho se concluye que en la poblacion de la que se extr~io la muestra la variable dependiente esta relacionada en forma lineal con las variables independientes como un solo grupo Si no se rechazaHose conshycluye que en la poblacion no existe relacion lineal entre la variable depenshydiente y las variables independientes como un solo grupo

10 El valor de p Se obtiene e1 valorp a partir de la tabla para la distribuci6n F

Con el siguiente ejemplo se muestra el procedimiento de la prueba de hipotesis

F~EMPLO 1042

Se pretende probar la hipotesis nula de que no hay relacion lineal entre las tres variables analizadas en e1 ejemplo 1031 1-450IA2 el numero de cigarros fumados por dfa y el nive1 de cotinina urinaria

Solucion

1 Datos Vease la descripcion de los datos dados en el ejemplo 1031

488 CAPITULO 10 REGRESION Y CORRELACION ~nJLTIPLE

2 Supuestos Se supone que las consideraciones analizadas en la secci6n 102 se cumplen

3 Hipotesis

Ho 13 = 132 0

H A no todas las 13i = 0

4 Estadistica de prueba La estadistica de prueba es Rv 5 Distribucion de Ia prueba estadistica Si Ho es verdadera y las

suposiciones se cumplen la estadistica de prueba sigue una distrishybuci6n F con 2 como numerador y 16 como denominador para los grados de libertad

6 RegIa de decision Se utiliza un nivel trascendente de a OL Por 10 tanto la regIa de decisi6n rechaza Ho si el valor calculado de RV es mayor 0 igual que 623

7 Calculo de la estadistica de prueba En la FIgura 1031 se muesshytra la tabla ANOVA para este ejemplo en la cual se puede ver que RV es igual a 3056

8 Decision estadistica Puesto que 3056 es mayor que 623 se reshychaza Ho

9 Conclusion Se concluye que en la poblaci6n de la cual se extrashyjo la muestra existe relaci6n lineal entre las tres variables

10 Valor de p Puesto que 3056 es mayor que 751 el valor de p para la prueba es menor que 005 bull

Inferencias con respecto a las f3 individuales Por 10 general se pretenshyde evaluar la fuerza de la relaci6n lineal entre Y y las variables independientes de manera individual Es decir se pretende probar la hip6tesis nula 13i 0 contra la hip6tesis alternativa 13

i 0 ( i 12 k) La validez de este procedimiento se apoya

en las suposiciones establecidas previamente para cada combinaci6n de los valores de Xi existe una subpoblaci6n de valores de Y que siguen una distribuci6n nonnal con variancia a2bull

Prueba de hip6tesis para las f3t Para probar la hip6tesis nula de que es igual a algful valor en particular por ejemplo 130 es posible calcular la estadfstica de t

t (1043)

donde los grados de libertad son igual an - k - 1 Y es la desviaci6n estandar de las b

Las desviaciones estandar de las b estan dadas como parte de los resultados de la mayorfa de paquetes de software para computadora que hacen analisis de regresi6n

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 2: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

475 102 MODELO DE REGRESION LINEAL MULTIPLE

Los conceptos y tecnicas para elamilisis de asodacion entre diversas variables son extensiones naturales de las variables estudiadas en los capitulos anterioresLos caIculos como se pudiera esperar son mas complejos y laboriosos Sin embargo tal como se mendona en el capitulo 9 esto no representa realmente un problema cuando se dispone de una computadora No es raro encontrar investigadores que estudian las relaciones existentes en una docena de variables 0 mas Para aquellos que tienen acceso a una computadora la decision de cuantas variables incluir en un anaIisis se basa no en la complejidad y cantidad de los cilculos sino en consideradones de su significado el costo de inclusion y la importanda de su contribucion

En este capitulo se sigue estrictamente la secuencia del capitulo 8 Primero se estudia el modelo deregresion seguido por un anaIisis del modelo de correlacion AI considerar el modelo de regresion se cubren los siguientes puntos una descripcion del modelo los metodos para obtener la ecuacion de regresion la evaluacion de la ecuacion y los usos que pueden hacerse de ella En ambos modelos se estudian los procedimientos inferendales y sus suposiciones fundamentales

102 MODELO DE REGRESION LINEAL MULTIPLE

En el modelo de regresion multiple se supone que existe una relacion lineal entre alguna variable Y ala cual se Ie da el nombre de variable dependiente y k variables independientes Xl X 2 Xkbull A veces a las variables independientes se les llama variables explicativas porque se utilizan para explicar la variacion en Y Tambien se les conoce como variables de predicci6n pues se usan para predecir a Y

Supuestos (restricciones) Las suposiciones en las que se basa el analisis de regresion multiple son las siguientes

1 Las Xi son variables no aleatorias (fUas) Esta suposicion distingue al modelo de regresion multiple del modelo de correlacion multiple el cual se estudia en la seccion 106 Esta condicion indica que cualquier inferencia que se haga de los datos de la muestra solo se aplica al con junto de valores de X observados y no para alg11n conjunto mayor de valores de X Bajo el modelo de regresion el anaIisis de correladon carece de significado Bajo el modelo de correladon que se estudia mas adelante pueden aplicarse las tecnicas de reshygresion que siguen

2 Para cada conjunto de Xi valores existe una subpoblacion de valores de Y Para construir algunos intervalos de confianza y probar hipotesis se debe saber 0

el investigador debe inclinarse a suponer que estas subpobladones de valores de Y siguen una distribucion normal Puesto que se pretende demostrar estos procedimientos de inferencia se supondra que los datos de los ejemplos y ejercicios de estecapitulo presentan unadistribucion normal

476 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

3 Las variancias de las subpoblaciones de Y son todasiguales

4 Los valores de Y son independientes Esto es los valores de Y seleccionados para un conjunto de valores de X no dependen de los valores de Y seleccionashydos en otto conjuntode valores de X

Ecuucion del modelo Estas suposiciones para el analisis de regresi6n multishyple pueden enunciarseen forma mas concretacomo

(1021)

donde Yj es un valor representativo de una de las subpoblaciones de los valores de Y las ~i son los coeficientes de regresi6n las xl X2 bullbullbull xk son respectivamente los

valores especfficos de las variables independie6teXl X Xp yej es una variable aleatoria con media 0 y variancia 02 la variancia comun a las subpoblaciones de los

valores de Y Para construir intervalos de confianza para los coeficientes de regreshysi6n y probar las hip6tesis se supone que los valores de ej siguen una distribuci6n normal independiente Las afirmaciones referentes a ej son consecuencia de las suposiciones respecto a las distribuciones de los valores de Y Ala ecuaci6n 1021 se Ie conoce como el modelo de regresion lineal multiple

Cuando la ecuaci6n 1021 consta de una variable dependiente y dos variables independientes es decir cuando el modelo se escribe como

Yj ~o + ~JXlj + ~2X2j +e j (1022)

puede ajustarse un plano en el espacio tridimensional a los puntos de los datos tal como se muestra en la figura 1021 Cuando el modelo contiene mas de dos variashybles independientes se describe geometricamente comoun hiperplano

y

it f

it

x

FIGURA 1021 Planoy dispersi6n depuntos de la regresi6n multiple

477 103 OBTENCION DE LA ECUACION DE REGRESION MUITIPLE

En la figura 1021 es posible visualizar algunos de los puntos arriba del plano y otros abajo La desviacion de un punto a partir del plano se representa con la siguiente ecuaci6n

(1023)

En la ecuacion 1022 ~o representa el punto donde el plano corta al eje Y es decir representa la interseccion del plano con Y ~1 mide el cambio promedio en Y por unidad de cambio en XI cuando X2 permanece sin cambio y ~2mide el cambio promedio en Y par unidad de cambio en X2 cuand() XI permanece sin cambio Por esta razon ~I y ~2 son los coeficientes de regresi6n parcial

103 OBm~CION DE IA ECUACION DEREGRESION MULTIPLE

Las estimaciones insesgadas de los parametros ~o ~I bullbullbull ~k del modelo especificado en la ecuacion 1021 se obtienen mediante el metodo de los mfnimos ruadrados Esto significa que se minimiza la suma de las dcsviaciones elevadas al cuadrado de los valores observados de Y respecto dela superficie de regresion resultante En el caso de tres variables como se muestraen la figura 1021 la suma de las desviacioshynes al cuadrado de las observaciones respecto del plano es un minimo cuando se estiman ~o ~IY~2 por el metodode mfnimos ruadrados En otras palabras se seleccionan estimaciones de ~o ~J bullbullbull ~k de la muestra en tal forma que la cantidad

es minimizada Esta cantidad que es la suma de los cuadrados residuales tambien puede escribirse como

(1031)

para indicar el hecho de quese minimiza la suma de cuadrados de las desviaciones de los val ores observados dey respecto de los valores de esta variable calculados a partir de la ecuacion estimada

Las estimaciones de los panimetros de regresion multiple se pueden obtener mediante calculos aritmeticoshechos con una calculadora de bolsillo Este metodo para obtener las estimaciones es laborioso consume tiempo esta sujeta a errores y es una perdida de tiempo cuando se dispone de una computadora Aquellos que esten interesados en analizar 0 utilizar el metodo aritmetico pueden consultar las primeras ediciones de este libro 0 las obras de Snedecor y Cochran (1) Y Steel y Torrie (2) quienes ofrecen ejemplosnumericos para cuatro variables Anderson y Bancroft (3) muestran los caIculos involucrados ruando existen cinco variables En el siguiente ejemplo se utilizo el paquete MINITAB para mostrar la aplicacion del analisis de regresion Illultiple

478 CAPiTuLO 10 REGRESION Y CORRELACION MULTIPLE

FJEMPLO 1031

Kalow y Tang (A-I) condujeron un estudio para establecer la variaci6n de las actividades del citocromo P-450IA2 determinada mediante la cafeina en una poshyblaci6n de voluntarios sanos EI segundo objetivo del estudio era comparar la variaci6n en fumadores contra la mayorfa de no fumadores de la poblaci6n Los individuos respondieron a los carteles colocados en el edificio de ciencias medishycas de unauniversidad Las variables sobre las que el investigador recolect6 datos fueron 1)- indice deP-450IA2 (Indice IA2) 2) numero de cigarros fumados por dia (Cigdfa) y 3) nivel de cotihina urinaria (Cot) Las mediciones de estas tres variables para 19 individuos semuestran en la tabla 1031 Se pretende obtener la ecuaci6n de regresi6n multiple

Soluci6n Se ingresan las observaciones de las variables Cigldfa Cot e Indice IA2 en cl c2 y c3 y se les nombra Xl X2 Y Y respectivamente La caja de dialoshygo MINITAB el comando de la sesi6n y lasalida se muestra en la figura

TABlA 1031 Ntimero de cigarros fumados por dia nivel de cotinina urinaria e indice de P~450IA2para

19 individuos descritos en el ejemplo 1031

Cigdia Cot Indice 1A2

1 0000 41648 1 0000 37314 1 0000 57481 1 0000 44370 1 0000 64687 3 0000 38923 8 105950 52952 8 46154 46031 8 271902 58112 8 55319 36890 8 27778 33722

10 197856 80213 10 228045 108367 15 0000 41148 15 145193 55429 15 367113 113531 20 212267 75637 20 211273 72158 24 632125 135000

FUENTE UtiIizada con autorizaci6n de Werner Kalow

419 103 OBTENCION DE LA ECUACIONDE REGRESION MULTIPLE

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Regression MTB gt Name C4 SRES1 Teclear Yen Response y Xl X2 CS = FITS1 C6 = RESI1 en Predictors MTB gt Regress y 2 xl x2 Verificar Residuals SUBCgt SResiduals SRES1 i Verificar Standard resids SUBCgt Fits FITS1 ClicOK SUBCgt Constant

SUBCgt Residuals RESI1

Resultados

Regression Analysis The regression equation is y = 452 00517 xl + 0170 x2

Predictor Coef Stdev t-ratio p Constant 45234 05381 841 0000 xl -005169 006950 074 0468 x2 017020 003013 565 0000

s 1390 R-sq =793 R-sq(adj) = 767

Analysis of Variance

SOURCE DF SS MS F P Regression 2 118060 59030 3056 0000 Error 16 30911 1932 Total 18 148971

SOURCE DF SEQ SS xl 1 56403 x2 1 61658

Unusual Observationns Obs xl y Fit StdevFit Residual StResid

9 80 5 811 8738 0589 -2926 -232R 13 100 10837 7888 0409 2949 222R 19 240 13500 14042 1043 -0542 -059X

R denotes an obs with a large st resid X denotes an obs whose X value gives it large influence

FIGURA 1031 Procedimiento MINITAB Y resultados para el ejemplo 103 L

480 CAPITULO 10 REGRESION Y CQRRELACION MULTIPLE

Sistema SAS

Model MODELl Dependent Variable IA2

Analysis of variance

Sum of Mean

Source DF Squares Square F Value ProbgtF

Model 2 11806041 5903020 30555 00001 Error 16 3091080 1 93192

C Total 18 14897121

Root MSE 1 38994 R-square 07925 Dep Mean 628217 Adj R-sq 07666 CV 2212510

Parameter Estimates

Parameter Standard T for HO Variable DF Estimate Error Parameter=O Prob gt ITI

INTERCEP 1 4523383 053806674 8407 00001

COT 1 0170201 003012742 5649 00001 CIGDAY 1 -0051693 006950225 0744 04678

FIGURA 1032 Resultados producidos por el paquete SASreg para el ejemplo 1031

1031 A partir de los resultados se observa que la ecuaci6n de regresi6n multiple en la notaci6n de la secci6n 102 es

y = 45234-05169x1j +17020x2j

En las secciones siguientes se estudian otros ejemplos En la figura 1032 se muestran los resultados del paquete SAS

para el ejemplo 1031 bull

Despues de obtener la ecuaci6n de regresi6n multiple el siguiente paso es evaluar e interpretar En la siguiente secci6n se cubre esta faceta del amHisis

EJERCICIOS 481

FJERCICIOS

Obtenga la ecuaci6n de regresi6n para cada uno de los siguientes con juntos de datos

1031 Los individuos estudiados por Malec et al (A-2) fueron 16 graduados de un programa inteshygral de rehabilitaci6n de lesiones cerebrales postagudas Los investigadores examinaron las relaciones entre diversas variables que induian el resultado de trabajo (la escala iba de I para desempleado hasta 5 que representa empleo competitivo sin prestaciones) la calificaci6n al momento de la evaluaci6n inicial sobre el inventario de adaptabilidad Portland (PAl por sus siglas en Ingles) y el tiempo de permanencia en dfas Las mediciones registradas sobre estas tres variables son las siguientes

y XI

Resultado Tiempode x2 del permanencia PAl trabajo (dias) PRE

5 67 19 4 157 17 2 242 23 4 255 14 1 227 27 4 140 22 1 179 23 4 258 18 4 85 16 5 52 22 3 296 15 1 256 30 4 198 21 1 224 22 4 126 19 4 156 8

FUENn Utilizada con autorizaci6n deJames Malec PhD

1032 David y Riley (A-3) examinaron los factores cognoscitivos medidos con la prueba de nivel cognoscitivo de Allen (ACL por sus siglas en Ingles) y la relaci6n de la prueba con el nive de psicopatologfa Los individuos estudiados eran pacientes de la unidad de psiquiatrfa del Hospital GeneraL Entre las variables sobre las que trabajaron los investigadores ademas del ACL estaban las calificaciones sobre el vocabulario (V) y la abstracci6n (A) componenshytes del Instituto Shipley de la escala de vida y las calificaciones sobre la prueba de modalishydades de simbologia digital (PMSD) Se registraron las siguientes mediciones en 69 pacientes La variable dependiente es ACL

Individuo ACL PMSD V A

432 CAPITULO 10 REGRESI6N Y CORRELACI6N MULTIPLE

Individuo ACL PMSD V A

1 60 70 2 54 49 3 47 28 4 48 47 5 49 29 6 45 23 7 63 40 8 59 50 9 41 32

10 48 27 11 40 33 12 45 40 13 58 66 14 60 46 15 45 26 16 47 42

28 34 19 32 22 24 24 18 31 14 24 34 29 27 15 31

36 32 8

28 4

24 12 14 20

8 8

36 20 34 10 24

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

59 47 47 38 60 56 48 58 45 48 47 45 60 56 63 52

42 52 35 41 58 41 13 62 46 52 63 42 66 55 55 43

30 17 26 18 32 19 14 27 21 26 22 22 30 26 22 22

26 26 28 26 16 10 36 20 28 14 26 26 26 28 28

Individuo ACL PMSD V A

10 36 30 16 8 2

32 36 18 18 20 8

30 6 6 8 6 8

22 FUENTE Utilizada con autorizaci6n de Sandra K David OTRL

1033 En un estudio acerca de la percepcion de los posibles facto res relacionados con los patrones de admision en un gran hospital un administrador obtuvo estos datos a partir de 10 comushynidades dentro del area de captacion del hospital

16 32 26 11 18 14 30 30 31 23 28 17 31 12 18 23 22 13 30

Individuo ACL PMSD V A

52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

45 49 42 45 48 60 40 45 40 47 60 45 48 66 41 45 66 49

33 48 34 58 35 48 36 37 37 45 38 49 39 50 40 39 41 37 42 56 43 48 44 56 45 66 46 43 47 40 48 42 49 56 50 34 51 40

48 47 50 29 17 39 31 61 45 56 53 29 63 19 23 40 20

2 41

44 51 37 56 37 76 42 20 48 54 53 39 35 63 17 44 47 35

29 28 20 32 33 26 26 13 27 40 25 20 26 26 16 31 30 10

24 36 8

36 36 20 8

10 16 40 32

8 10 30 16 24 36 19

EJERCICIOS 483

Personas por cada 1000 Indice de disponibilidad internadas durante el de otros servicios de Indice de

periodo de estudio salud indigencia Comunidad (Y) (Xl) (X2)

1 616 60 63 2 532 44 55 3 655 91 36 4 649 81 58 5 727 97 68 6 522 48 79 7 502 76 42 8 440 44 60 9 538 91 28 10 535 67 67

Total 5716 699 556

1034 El administrador de un hospital general obtuvo los siguientes datos de 20 pacientes interveshynidos quirurgicamente durante un estudio para determinar que factores parecen estar relashycionados con eI tiempo de hospitalizacion

Tiempo de permanencia Numero de problemas Tiempo de permanencia posoperatoria en dias (Y) medicos actualmente (Xl) preoperatoria en dias (X2)

6 1 1 6 2 1

11 2 2 9 1 3

16 3 3 16 1 5 4 1 1 8 3 1

11 2 2 13 3 2 13 1 4 9 1 2

17 3 3 17 2 4 12 4 1 6 1 1 5 1 1

12 3 2 8 1 2 9 2 2

Total 208 38 43

484 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

1035 Una muestra aleatoria de 25 enfermeras seleccionadas de un directorio de enfermeras generales produjo la siguiente informaci6n respecto a la calificaci6n del examen de colocaci6n de cada una de elIas realizado por la direcci6n estatal de personal (en Estados Unidos) y la calificaci6n final de graduaci6n escolar Ambas calificaciones se relacionan con el area de afiliaci6n de las enfermeras Ademas se tuvo informaci6n de las calificaciones obtenidas por cada enfermera en una prueba de aptitud realizada al ingresar a la escuela de enfermeria Los datos completos son los siguientes

Calificaci6n de aprobaci6n Calificaci6n de la por el estado (Y) Calificaci6n final (Xl) prueba de aptitud (X

2)

440 87 92 480 87 79 535 87 99 460 88 91 525 88 84 480 89 71 510 89 78 530 89 78 545 89 71 600 89 76 495 90 89 545 90 90 575 90 73 525 91 71 575 91 81 600 91 84 490 92 70 510 92 85 575 92 71 540 93 76 595 93 90 525 94 94 545 94 94 600 94 93 625 94 73

Total 13425 2263 2053

1036 Se registraron los siguientes datos para una muestra aleatoria simple de 20 pacientes con hipertensi6n Las variables son

Y presi6n arterial sanguinea media (mm Hg)

XI edad (en afios)

X2 peso (kg)

X3 = area de la superficie corporal (m2)

X4

duraci6n de la hipertensi6n (afios)

X5 pulso basico (latidosmin)

X6 medici6n del estres

104 EVAIUACION DE LA ECUACION DE REGRESION MULTIPLE 485

Paciente Y Xl X2 X3 X4 X5 X6

1 105 47 854 175 51 63 33 2 115 49 942 210 38 70 14 3 116 49 953 198 82 72 10 4 117 50 947 201 58 73 99 5 112 51 894 189 70 72 95 6 121 48 995 225 93 71 10 7 121 49 998 225 25 69 42 8 110 47 909 190 62 66 8 9 110 49 892 183 71 69 62

10 114 48 927 207 56 64 35 11 114 47 944 207 53 74 90 12 115 49 941 198 56 71 21 13 114 50 916 205 102 68 47 14 106 45 871 192 56 67 80 15 125 52 1013 219 100 76 98 16 114 46 945 198 74 69 95 17 106 46 870 187 36 62 18 18 113 46 945 190 43 70 12 19 110 48 905 188 90 71 99 20 122 56 957 209 70 75 99

104 EVALUACION DE L ECUACION DE REGRESION MULTIPLE

Antes de utilizar una ecuaci6n de regresi6n multiple para predicci6n y estimaci6n es conveniente determinar primero si de hecho vale la pena utilizarla AI estudiar la regresi6n lineal simple se aprendi6 que puede evaluarse la utili dad de una ecuaci6n de regresi6n considerando el coeficiente de determinaci6n de la muestra y la penshydiente estimada AI evaluar la ecuaci6n de regresi6n multiple la atenci6n se centra en el coeficiente de determinaci6n multiple y los coeficientes de regresi6n parciales

El coeficiente de determinacion mUltiple En el capitulo 9 se estudia con detalle el coeficiente de determinaci6n El concepto se extiende 16gicamente al caso de la regresi6n multiple La variacion total presente en los valores de Y puede dividirshyse en dos componentes la variaci6n explicada que mide la cantidad de la variaci6n total que es explicada por la superficie de regresi6n ajustada y la variaci6n inexplicashyda que es aquella parte de la variaci6n total que no es explicada por el ajuste de la superficie de regresion La medida de la variaci6n en cada caso es una suma de desshyviaciones elevadas al cuadrado La variaci6n total es la surna de desviaciones al cuashydrado de cada observaci6n de Ya partir de la media de las observaciones y se designa por 2(Yj - y)2 0 SC

tata] La variaci6n explicada designada por 2(yj )1)2 es la surna

de las desviaciones al cuadrado de los valores calculados a partir de la media de los val ores de Y observados Esta suma de desviaciones al cuadrado es la suma de cuadrashy

486 CAPITULO 10 REGRESIONY CORRELACION MULTIPLE

dos debida a la regresi6n (SCR) La variacion inexplicada escrita como 2(Yj y)2es la

suma de las desviaciones al cuadrado de las observaciones originales a partir de los valores calculados A esta cantidad se Ie conoce tambien como la suma de cuadrados en torno a la regresiOn 0 la suma del cuadrado de los errores (SCE) Se puede resumir la relashycion entre las tres sumas de cuadrados con la siguiente ecuacion

L(Yj W L(Yj - W + L(Yj - Yj)2 (1041)

SCwtal = SCR + SCE

suma total de cuadrados = suma de cuadrados explicados (debido a la regresion) + suma de cuadrados no explicados (de los errores)

El coeficiente de determinacion multiple R12 k se obtiene al dividir la suma de cuadrados explicados entre la suma total de cuadrados Esto es

R2 = L(Yj - y)2 (1042)y12 L(Yj _ y)2

El subindice y12 k nos seiiala que en el analisis Yes tratada como variable dependiente y que las variables desde Xl hasta X

k son tratadas como variables indeshy

pendientes EI valor de R12k indica que proporcion del total de variacion en los valores de Y observados es explicada por la regresion de Y sobre XI X

2 bull bull X En

otras palabras se dice que R12 k es una medida de bondad de ajuste de la superfishycie de regresion Esta cantidad es analoga a r2 calculada en el capitulo 9

FJEMPLO 1041

Con suite el ejercicio 1031 Ycalcule R12

Solndon Para el ejemplo se tiene en la figura 1031 que

SC = 1489671total

SCR = 118060 SCE 30911

R212 = 118060 = 7925 7930 y 148971

Se puede decir que aproximadamente 793 por ciento del total de la variacion en los valores de Y se explica a traves del plano de regresion ajustado es decir a traves de la relacion lineal con Xl y X2bull bull

Prueba de hip6tesis de ta regresi6n Para determinar si la regresion comshypleta es significativa (es decir para determinar si R212 es trascendente) se puede aplicar la prueba de hipotesis como sigue Y

1 Datos La situacion de la investigacion y los datos generados por el investishygador se examinan para determinar si la regresion multiple es una tecnica

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 487

TABlA 1041 Tabla NOVA para la regresion multiple

Fuente SC gl CM Rv

Debido a la regresi6n Respecto a la regresi6n

SCR SCE

k n-k-l

CMR SCRk CME = SCE(n-k-l)

CMRCME

Total SCtotal

n 1

2 Supuestos Se considera que el modelo de regresi6n multiple y las suposishyciones basicas tal como se presentan en la secci6n 102 son ap1icables

3 Hipotesis En general la hip6tesis nula es Ho P = P == P = Ph 0 y l 2 3 la hip6tesis alternativa es H

A no todas las Pi = O En palabras la hip6tesis nula

afrrma que todas las variables independientes carecen de valor para explicar la variaci6n enlos valores de Y

4 Estadistica de prueba La estadfstica de prueba conveniente es RY que se calcula como parte del analisis de la variancia La tabla AN OVA se muestra en la tabla 10041 En la tabla 10041 CMR simboliza el cuadrado medio debido a la regresi6n y CME simboliza el cuadrado medio respecto a la regresi6n 0

como algunas veces se Ie llama el cuadrado medio del error

5 Distribuci6n de la estadistica de prueba Cuando Ho es verdadera y se cumshyplen las suposiciones RY sigue una distribuci6n F con k y n - k - 1 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de RY es mayor 0

igual que el valor cdtico de F

7 Ca1cular la estadfstica de prueba Vease la tabla 1004 I

8 Decision estadistica Se rechaza 0 no se rechaza Ho de acuerdo con la regIa de decisi6n

9 Conclusion Si se rechaza Ho se concluye que en la poblacion de la que se extr~io la muestra la variable dependiente esta relacionada en forma lineal con las variables independientes como un solo grupo Si no se rechazaHose conshycluye que en la poblacion no existe relacion lineal entre la variable depenshydiente y las variables independientes como un solo grupo

10 El valor de p Se obtiene e1 valorp a partir de la tabla para la distribuci6n F

Con el siguiente ejemplo se muestra el procedimiento de la prueba de hipotesis

F~EMPLO 1042

Se pretende probar la hipotesis nula de que no hay relacion lineal entre las tres variables analizadas en e1 ejemplo 1031 1-450IA2 el numero de cigarros fumados por dfa y el nive1 de cotinina urinaria

Solucion

1 Datos Vease la descripcion de los datos dados en el ejemplo 1031

488 CAPITULO 10 REGRESION Y CORRELACION ~nJLTIPLE

2 Supuestos Se supone que las consideraciones analizadas en la secci6n 102 se cumplen

3 Hipotesis

Ho 13 = 132 0

H A no todas las 13i = 0

4 Estadistica de prueba La estadistica de prueba es Rv 5 Distribucion de Ia prueba estadistica Si Ho es verdadera y las

suposiciones se cumplen la estadistica de prueba sigue una distrishybuci6n F con 2 como numerador y 16 como denominador para los grados de libertad

6 RegIa de decision Se utiliza un nivel trascendente de a OL Por 10 tanto la regIa de decisi6n rechaza Ho si el valor calculado de RV es mayor 0 igual que 623

7 Calculo de la estadistica de prueba En la FIgura 1031 se muesshytra la tabla ANOVA para este ejemplo en la cual se puede ver que RV es igual a 3056

8 Decision estadistica Puesto que 3056 es mayor que 623 se reshychaza Ho

9 Conclusion Se concluye que en la poblaci6n de la cual se extrashyjo la muestra existe relaci6n lineal entre las tres variables

10 Valor de p Puesto que 3056 es mayor que 751 el valor de p para la prueba es menor que 005 bull

Inferencias con respecto a las f3 individuales Por 10 general se pretenshyde evaluar la fuerza de la relaci6n lineal entre Y y las variables independientes de manera individual Es decir se pretende probar la hip6tesis nula 13i 0 contra la hip6tesis alternativa 13

i 0 ( i 12 k) La validez de este procedimiento se apoya

en las suposiciones establecidas previamente para cada combinaci6n de los valores de Xi existe una subpoblaci6n de valores de Y que siguen una distribuci6n nonnal con variancia a2bull

Prueba de hip6tesis para las f3t Para probar la hip6tesis nula de que es igual a algful valor en particular por ejemplo 130 es posible calcular la estadfstica de t

t (1043)

donde los grados de libertad son igual an - k - 1 Y es la desviaci6n estandar de las b

Las desviaciones estandar de las b estan dadas como parte de los resultados de la mayorfa de paquetes de software para computadora que hacen analisis de regresi6n

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 3: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

476 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

3 Las variancias de las subpoblaciones de Y son todasiguales

4 Los valores de Y son independientes Esto es los valores de Y seleccionados para un conjunto de valores de X no dependen de los valores de Y seleccionashydos en otto conjuntode valores de X

Ecuucion del modelo Estas suposiciones para el analisis de regresi6n multishyple pueden enunciarseen forma mas concretacomo

(1021)

donde Yj es un valor representativo de una de las subpoblaciones de los valores de Y las ~i son los coeficientes de regresi6n las xl X2 bullbullbull xk son respectivamente los

valores especfficos de las variables independie6teXl X Xp yej es una variable aleatoria con media 0 y variancia 02 la variancia comun a las subpoblaciones de los

valores de Y Para construir intervalos de confianza para los coeficientes de regreshysi6n y probar las hip6tesis se supone que los valores de ej siguen una distribuci6n normal independiente Las afirmaciones referentes a ej son consecuencia de las suposiciones respecto a las distribuciones de los valores de Y Ala ecuaci6n 1021 se Ie conoce como el modelo de regresion lineal multiple

Cuando la ecuaci6n 1021 consta de una variable dependiente y dos variables independientes es decir cuando el modelo se escribe como

Yj ~o + ~JXlj + ~2X2j +e j (1022)

puede ajustarse un plano en el espacio tridimensional a los puntos de los datos tal como se muestra en la figura 1021 Cuando el modelo contiene mas de dos variashybles independientes se describe geometricamente comoun hiperplano

y

it f

it

x

FIGURA 1021 Planoy dispersi6n depuntos de la regresi6n multiple

477 103 OBTENCION DE LA ECUACION DE REGRESION MUITIPLE

En la figura 1021 es posible visualizar algunos de los puntos arriba del plano y otros abajo La desviacion de un punto a partir del plano se representa con la siguiente ecuaci6n

(1023)

En la ecuacion 1022 ~o representa el punto donde el plano corta al eje Y es decir representa la interseccion del plano con Y ~1 mide el cambio promedio en Y por unidad de cambio en XI cuando X2 permanece sin cambio y ~2mide el cambio promedio en Y par unidad de cambio en X2 cuand() XI permanece sin cambio Por esta razon ~I y ~2 son los coeficientes de regresi6n parcial

103 OBm~CION DE IA ECUACION DEREGRESION MULTIPLE

Las estimaciones insesgadas de los parametros ~o ~I bullbullbull ~k del modelo especificado en la ecuacion 1021 se obtienen mediante el metodo de los mfnimos ruadrados Esto significa que se minimiza la suma de las dcsviaciones elevadas al cuadrado de los valores observados de Y respecto dela superficie de regresion resultante En el caso de tres variables como se muestraen la figura 1021 la suma de las desviacioshynes al cuadrado de las observaciones respecto del plano es un minimo cuando se estiman ~o ~IY~2 por el metodode mfnimos ruadrados En otras palabras se seleccionan estimaciones de ~o ~J bullbullbull ~k de la muestra en tal forma que la cantidad

es minimizada Esta cantidad que es la suma de los cuadrados residuales tambien puede escribirse como

(1031)

para indicar el hecho de quese minimiza la suma de cuadrados de las desviaciones de los val ores observados dey respecto de los valores de esta variable calculados a partir de la ecuacion estimada

Las estimaciones de los panimetros de regresion multiple se pueden obtener mediante calculos aritmeticoshechos con una calculadora de bolsillo Este metodo para obtener las estimaciones es laborioso consume tiempo esta sujeta a errores y es una perdida de tiempo cuando se dispone de una computadora Aquellos que esten interesados en analizar 0 utilizar el metodo aritmetico pueden consultar las primeras ediciones de este libro 0 las obras de Snedecor y Cochran (1) Y Steel y Torrie (2) quienes ofrecen ejemplosnumericos para cuatro variables Anderson y Bancroft (3) muestran los caIculos involucrados ruando existen cinco variables En el siguiente ejemplo se utilizo el paquete MINITAB para mostrar la aplicacion del analisis de regresion Illultiple

478 CAPiTuLO 10 REGRESION Y CORRELACION MULTIPLE

FJEMPLO 1031

Kalow y Tang (A-I) condujeron un estudio para establecer la variaci6n de las actividades del citocromo P-450IA2 determinada mediante la cafeina en una poshyblaci6n de voluntarios sanos EI segundo objetivo del estudio era comparar la variaci6n en fumadores contra la mayorfa de no fumadores de la poblaci6n Los individuos respondieron a los carteles colocados en el edificio de ciencias medishycas de unauniversidad Las variables sobre las que el investigador recolect6 datos fueron 1)- indice deP-450IA2 (Indice IA2) 2) numero de cigarros fumados por dia (Cigdfa) y 3) nivel de cotihina urinaria (Cot) Las mediciones de estas tres variables para 19 individuos semuestran en la tabla 1031 Se pretende obtener la ecuaci6n de regresi6n multiple

Soluci6n Se ingresan las observaciones de las variables Cigldfa Cot e Indice IA2 en cl c2 y c3 y se les nombra Xl X2 Y Y respectivamente La caja de dialoshygo MINITAB el comando de la sesi6n y lasalida se muestra en la figura

TABlA 1031 Ntimero de cigarros fumados por dia nivel de cotinina urinaria e indice de P~450IA2para

19 individuos descritos en el ejemplo 1031

Cigdia Cot Indice 1A2

1 0000 41648 1 0000 37314 1 0000 57481 1 0000 44370 1 0000 64687 3 0000 38923 8 105950 52952 8 46154 46031 8 271902 58112 8 55319 36890 8 27778 33722

10 197856 80213 10 228045 108367 15 0000 41148 15 145193 55429 15 367113 113531 20 212267 75637 20 211273 72158 24 632125 135000

FUENTE UtiIizada con autorizaci6n de Werner Kalow

419 103 OBTENCION DE LA ECUACIONDE REGRESION MULTIPLE

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Regression MTB gt Name C4 SRES1 Teclear Yen Response y Xl X2 CS = FITS1 C6 = RESI1 en Predictors MTB gt Regress y 2 xl x2 Verificar Residuals SUBCgt SResiduals SRES1 i Verificar Standard resids SUBCgt Fits FITS1 ClicOK SUBCgt Constant

SUBCgt Residuals RESI1

Resultados

Regression Analysis The regression equation is y = 452 00517 xl + 0170 x2

Predictor Coef Stdev t-ratio p Constant 45234 05381 841 0000 xl -005169 006950 074 0468 x2 017020 003013 565 0000

s 1390 R-sq =793 R-sq(adj) = 767

Analysis of Variance

SOURCE DF SS MS F P Regression 2 118060 59030 3056 0000 Error 16 30911 1932 Total 18 148971

SOURCE DF SEQ SS xl 1 56403 x2 1 61658

Unusual Observationns Obs xl y Fit StdevFit Residual StResid

9 80 5 811 8738 0589 -2926 -232R 13 100 10837 7888 0409 2949 222R 19 240 13500 14042 1043 -0542 -059X

R denotes an obs with a large st resid X denotes an obs whose X value gives it large influence

FIGURA 1031 Procedimiento MINITAB Y resultados para el ejemplo 103 L

480 CAPITULO 10 REGRESION Y CQRRELACION MULTIPLE

Sistema SAS

Model MODELl Dependent Variable IA2

Analysis of variance

Sum of Mean

Source DF Squares Square F Value ProbgtF

Model 2 11806041 5903020 30555 00001 Error 16 3091080 1 93192

C Total 18 14897121

Root MSE 1 38994 R-square 07925 Dep Mean 628217 Adj R-sq 07666 CV 2212510

Parameter Estimates

Parameter Standard T for HO Variable DF Estimate Error Parameter=O Prob gt ITI

INTERCEP 1 4523383 053806674 8407 00001

COT 1 0170201 003012742 5649 00001 CIGDAY 1 -0051693 006950225 0744 04678

FIGURA 1032 Resultados producidos por el paquete SASreg para el ejemplo 1031

1031 A partir de los resultados se observa que la ecuaci6n de regresi6n multiple en la notaci6n de la secci6n 102 es

y = 45234-05169x1j +17020x2j

En las secciones siguientes se estudian otros ejemplos En la figura 1032 se muestran los resultados del paquete SAS

para el ejemplo 1031 bull

Despues de obtener la ecuaci6n de regresi6n multiple el siguiente paso es evaluar e interpretar En la siguiente secci6n se cubre esta faceta del amHisis

EJERCICIOS 481

FJERCICIOS

Obtenga la ecuaci6n de regresi6n para cada uno de los siguientes con juntos de datos

1031 Los individuos estudiados por Malec et al (A-2) fueron 16 graduados de un programa inteshygral de rehabilitaci6n de lesiones cerebrales postagudas Los investigadores examinaron las relaciones entre diversas variables que induian el resultado de trabajo (la escala iba de I para desempleado hasta 5 que representa empleo competitivo sin prestaciones) la calificaci6n al momento de la evaluaci6n inicial sobre el inventario de adaptabilidad Portland (PAl por sus siglas en Ingles) y el tiempo de permanencia en dfas Las mediciones registradas sobre estas tres variables son las siguientes

y XI

Resultado Tiempode x2 del permanencia PAl trabajo (dias) PRE

5 67 19 4 157 17 2 242 23 4 255 14 1 227 27 4 140 22 1 179 23 4 258 18 4 85 16 5 52 22 3 296 15 1 256 30 4 198 21 1 224 22 4 126 19 4 156 8

FUENn Utilizada con autorizaci6n deJames Malec PhD

1032 David y Riley (A-3) examinaron los factores cognoscitivos medidos con la prueba de nivel cognoscitivo de Allen (ACL por sus siglas en Ingles) y la relaci6n de la prueba con el nive de psicopatologfa Los individuos estudiados eran pacientes de la unidad de psiquiatrfa del Hospital GeneraL Entre las variables sobre las que trabajaron los investigadores ademas del ACL estaban las calificaciones sobre el vocabulario (V) y la abstracci6n (A) componenshytes del Instituto Shipley de la escala de vida y las calificaciones sobre la prueba de modalishydades de simbologia digital (PMSD) Se registraron las siguientes mediciones en 69 pacientes La variable dependiente es ACL

Individuo ACL PMSD V A

432 CAPITULO 10 REGRESI6N Y CORRELACI6N MULTIPLE

Individuo ACL PMSD V A

1 60 70 2 54 49 3 47 28 4 48 47 5 49 29 6 45 23 7 63 40 8 59 50 9 41 32

10 48 27 11 40 33 12 45 40 13 58 66 14 60 46 15 45 26 16 47 42

28 34 19 32 22 24 24 18 31 14 24 34 29 27 15 31

36 32 8

28 4

24 12 14 20

8 8

36 20 34 10 24

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

59 47 47 38 60 56 48 58 45 48 47 45 60 56 63 52

42 52 35 41 58 41 13 62 46 52 63 42 66 55 55 43

30 17 26 18 32 19 14 27 21 26 22 22 30 26 22 22

26 26 28 26 16 10 36 20 28 14 26 26 26 28 28

Individuo ACL PMSD V A

10 36 30 16 8 2

32 36 18 18 20 8

30 6 6 8 6 8

22 FUENTE Utilizada con autorizaci6n de Sandra K David OTRL

1033 En un estudio acerca de la percepcion de los posibles facto res relacionados con los patrones de admision en un gran hospital un administrador obtuvo estos datos a partir de 10 comushynidades dentro del area de captacion del hospital

16 32 26 11 18 14 30 30 31 23 28 17 31 12 18 23 22 13 30

Individuo ACL PMSD V A

52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

45 49 42 45 48 60 40 45 40 47 60 45 48 66 41 45 66 49

33 48 34 58 35 48 36 37 37 45 38 49 39 50 40 39 41 37 42 56 43 48 44 56 45 66 46 43 47 40 48 42 49 56 50 34 51 40

48 47 50 29 17 39 31 61 45 56 53 29 63 19 23 40 20

2 41

44 51 37 56 37 76 42 20 48 54 53 39 35 63 17 44 47 35

29 28 20 32 33 26 26 13 27 40 25 20 26 26 16 31 30 10

24 36 8

36 36 20 8

10 16 40 32

8 10 30 16 24 36 19

EJERCICIOS 483

Personas por cada 1000 Indice de disponibilidad internadas durante el de otros servicios de Indice de

periodo de estudio salud indigencia Comunidad (Y) (Xl) (X2)

1 616 60 63 2 532 44 55 3 655 91 36 4 649 81 58 5 727 97 68 6 522 48 79 7 502 76 42 8 440 44 60 9 538 91 28 10 535 67 67

Total 5716 699 556

1034 El administrador de un hospital general obtuvo los siguientes datos de 20 pacientes interveshynidos quirurgicamente durante un estudio para determinar que factores parecen estar relashycionados con eI tiempo de hospitalizacion

Tiempo de permanencia Numero de problemas Tiempo de permanencia posoperatoria en dias (Y) medicos actualmente (Xl) preoperatoria en dias (X2)

6 1 1 6 2 1

11 2 2 9 1 3

16 3 3 16 1 5 4 1 1 8 3 1

11 2 2 13 3 2 13 1 4 9 1 2

17 3 3 17 2 4 12 4 1 6 1 1 5 1 1

12 3 2 8 1 2 9 2 2

Total 208 38 43

484 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

1035 Una muestra aleatoria de 25 enfermeras seleccionadas de un directorio de enfermeras generales produjo la siguiente informaci6n respecto a la calificaci6n del examen de colocaci6n de cada una de elIas realizado por la direcci6n estatal de personal (en Estados Unidos) y la calificaci6n final de graduaci6n escolar Ambas calificaciones se relacionan con el area de afiliaci6n de las enfermeras Ademas se tuvo informaci6n de las calificaciones obtenidas por cada enfermera en una prueba de aptitud realizada al ingresar a la escuela de enfermeria Los datos completos son los siguientes

Calificaci6n de aprobaci6n Calificaci6n de la por el estado (Y) Calificaci6n final (Xl) prueba de aptitud (X

2)

440 87 92 480 87 79 535 87 99 460 88 91 525 88 84 480 89 71 510 89 78 530 89 78 545 89 71 600 89 76 495 90 89 545 90 90 575 90 73 525 91 71 575 91 81 600 91 84 490 92 70 510 92 85 575 92 71 540 93 76 595 93 90 525 94 94 545 94 94 600 94 93 625 94 73

Total 13425 2263 2053

1036 Se registraron los siguientes datos para una muestra aleatoria simple de 20 pacientes con hipertensi6n Las variables son

Y presi6n arterial sanguinea media (mm Hg)

XI edad (en afios)

X2 peso (kg)

X3 = area de la superficie corporal (m2)

X4

duraci6n de la hipertensi6n (afios)

X5 pulso basico (latidosmin)

X6 medici6n del estres

104 EVAIUACION DE LA ECUACION DE REGRESION MULTIPLE 485

Paciente Y Xl X2 X3 X4 X5 X6

1 105 47 854 175 51 63 33 2 115 49 942 210 38 70 14 3 116 49 953 198 82 72 10 4 117 50 947 201 58 73 99 5 112 51 894 189 70 72 95 6 121 48 995 225 93 71 10 7 121 49 998 225 25 69 42 8 110 47 909 190 62 66 8 9 110 49 892 183 71 69 62

10 114 48 927 207 56 64 35 11 114 47 944 207 53 74 90 12 115 49 941 198 56 71 21 13 114 50 916 205 102 68 47 14 106 45 871 192 56 67 80 15 125 52 1013 219 100 76 98 16 114 46 945 198 74 69 95 17 106 46 870 187 36 62 18 18 113 46 945 190 43 70 12 19 110 48 905 188 90 71 99 20 122 56 957 209 70 75 99

104 EVALUACION DE L ECUACION DE REGRESION MULTIPLE

Antes de utilizar una ecuaci6n de regresi6n multiple para predicci6n y estimaci6n es conveniente determinar primero si de hecho vale la pena utilizarla AI estudiar la regresi6n lineal simple se aprendi6 que puede evaluarse la utili dad de una ecuaci6n de regresi6n considerando el coeficiente de determinaci6n de la muestra y la penshydiente estimada AI evaluar la ecuaci6n de regresi6n multiple la atenci6n se centra en el coeficiente de determinaci6n multiple y los coeficientes de regresi6n parciales

El coeficiente de determinacion mUltiple En el capitulo 9 se estudia con detalle el coeficiente de determinaci6n El concepto se extiende 16gicamente al caso de la regresi6n multiple La variacion total presente en los valores de Y puede dividirshyse en dos componentes la variaci6n explicada que mide la cantidad de la variaci6n total que es explicada por la superficie de regresi6n ajustada y la variaci6n inexplicashyda que es aquella parte de la variaci6n total que no es explicada por el ajuste de la superficie de regresion La medida de la variaci6n en cada caso es una suma de desshyviaciones elevadas al cuadrado La variaci6n total es la surna de desviaciones al cuashydrado de cada observaci6n de Ya partir de la media de las observaciones y se designa por 2(Yj - y)2 0 SC

tata] La variaci6n explicada designada por 2(yj )1)2 es la surna

de las desviaciones al cuadrado de los valores calculados a partir de la media de los val ores de Y observados Esta suma de desviaciones al cuadrado es la suma de cuadrashy

486 CAPITULO 10 REGRESIONY CORRELACION MULTIPLE

dos debida a la regresi6n (SCR) La variacion inexplicada escrita como 2(Yj y)2es la

suma de las desviaciones al cuadrado de las observaciones originales a partir de los valores calculados A esta cantidad se Ie conoce tambien como la suma de cuadrados en torno a la regresiOn 0 la suma del cuadrado de los errores (SCE) Se puede resumir la relashycion entre las tres sumas de cuadrados con la siguiente ecuacion

L(Yj W L(Yj - W + L(Yj - Yj)2 (1041)

SCwtal = SCR + SCE

suma total de cuadrados = suma de cuadrados explicados (debido a la regresion) + suma de cuadrados no explicados (de los errores)

El coeficiente de determinacion multiple R12 k se obtiene al dividir la suma de cuadrados explicados entre la suma total de cuadrados Esto es

R2 = L(Yj - y)2 (1042)y12 L(Yj _ y)2

El subindice y12 k nos seiiala que en el analisis Yes tratada como variable dependiente y que las variables desde Xl hasta X

k son tratadas como variables indeshy

pendientes EI valor de R12k indica que proporcion del total de variacion en los valores de Y observados es explicada por la regresion de Y sobre XI X

2 bull bull X En

otras palabras se dice que R12 k es una medida de bondad de ajuste de la superfishycie de regresion Esta cantidad es analoga a r2 calculada en el capitulo 9

FJEMPLO 1041

Con suite el ejercicio 1031 Ycalcule R12

Solndon Para el ejemplo se tiene en la figura 1031 que

SC = 1489671total

SCR = 118060 SCE 30911

R212 = 118060 = 7925 7930 y 148971

Se puede decir que aproximadamente 793 por ciento del total de la variacion en los valores de Y se explica a traves del plano de regresion ajustado es decir a traves de la relacion lineal con Xl y X2bull bull

Prueba de hip6tesis de ta regresi6n Para determinar si la regresion comshypleta es significativa (es decir para determinar si R212 es trascendente) se puede aplicar la prueba de hipotesis como sigue Y

1 Datos La situacion de la investigacion y los datos generados por el investishygador se examinan para determinar si la regresion multiple es una tecnica

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 487

TABlA 1041 Tabla NOVA para la regresion multiple

Fuente SC gl CM Rv

Debido a la regresi6n Respecto a la regresi6n

SCR SCE

k n-k-l

CMR SCRk CME = SCE(n-k-l)

CMRCME

Total SCtotal

n 1

2 Supuestos Se considera que el modelo de regresi6n multiple y las suposishyciones basicas tal como se presentan en la secci6n 102 son ap1icables

3 Hipotesis En general la hip6tesis nula es Ho P = P == P = Ph 0 y l 2 3 la hip6tesis alternativa es H

A no todas las Pi = O En palabras la hip6tesis nula

afrrma que todas las variables independientes carecen de valor para explicar la variaci6n enlos valores de Y

4 Estadistica de prueba La estadfstica de prueba conveniente es RY que se calcula como parte del analisis de la variancia La tabla AN OVA se muestra en la tabla 10041 En la tabla 10041 CMR simboliza el cuadrado medio debido a la regresi6n y CME simboliza el cuadrado medio respecto a la regresi6n 0

como algunas veces se Ie llama el cuadrado medio del error

5 Distribuci6n de la estadistica de prueba Cuando Ho es verdadera y se cumshyplen las suposiciones RY sigue una distribuci6n F con k y n - k - 1 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de RY es mayor 0

igual que el valor cdtico de F

7 Ca1cular la estadfstica de prueba Vease la tabla 1004 I

8 Decision estadistica Se rechaza 0 no se rechaza Ho de acuerdo con la regIa de decisi6n

9 Conclusion Si se rechaza Ho se concluye que en la poblacion de la que se extr~io la muestra la variable dependiente esta relacionada en forma lineal con las variables independientes como un solo grupo Si no se rechazaHose conshycluye que en la poblacion no existe relacion lineal entre la variable depenshydiente y las variables independientes como un solo grupo

10 El valor de p Se obtiene e1 valorp a partir de la tabla para la distribuci6n F

Con el siguiente ejemplo se muestra el procedimiento de la prueba de hipotesis

F~EMPLO 1042

Se pretende probar la hipotesis nula de que no hay relacion lineal entre las tres variables analizadas en e1 ejemplo 1031 1-450IA2 el numero de cigarros fumados por dfa y el nive1 de cotinina urinaria

Solucion

1 Datos Vease la descripcion de los datos dados en el ejemplo 1031

488 CAPITULO 10 REGRESION Y CORRELACION ~nJLTIPLE

2 Supuestos Se supone que las consideraciones analizadas en la secci6n 102 se cumplen

3 Hipotesis

Ho 13 = 132 0

H A no todas las 13i = 0

4 Estadistica de prueba La estadistica de prueba es Rv 5 Distribucion de Ia prueba estadistica Si Ho es verdadera y las

suposiciones se cumplen la estadistica de prueba sigue una distrishybuci6n F con 2 como numerador y 16 como denominador para los grados de libertad

6 RegIa de decision Se utiliza un nivel trascendente de a OL Por 10 tanto la regIa de decisi6n rechaza Ho si el valor calculado de RV es mayor 0 igual que 623

7 Calculo de la estadistica de prueba En la FIgura 1031 se muesshytra la tabla ANOVA para este ejemplo en la cual se puede ver que RV es igual a 3056

8 Decision estadistica Puesto que 3056 es mayor que 623 se reshychaza Ho

9 Conclusion Se concluye que en la poblaci6n de la cual se extrashyjo la muestra existe relaci6n lineal entre las tres variables

10 Valor de p Puesto que 3056 es mayor que 751 el valor de p para la prueba es menor que 005 bull

Inferencias con respecto a las f3 individuales Por 10 general se pretenshyde evaluar la fuerza de la relaci6n lineal entre Y y las variables independientes de manera individual Es decir se pretende probar la hip6tesis nula 13i 0 contra la hip6tesis alternativa 13

i 0 ( i 12 k) La validez de este procedimiento se apoya

en las suposiciones establecidas previamente para cada combinaci6n de los valores de Xi existe una subpoblaci6n de valores de Y que siguen una distribuci6n nonnal con variancia a2bull

Prueba de hip6tesis para las f3t Para probar la hip6tesis nula de que es igual a algful valor en particular por ejemplo 130 es posible calcular la estadfstica de t

t (1043)

donde los grados de libertad son igual an - k - 1 Y es la desviaci6n estandar de las b

Las desviaciones estandar de las b estan dadas como parte de los resultados de la mayorfa de paquetes de software para computadora que hacen analisis de regresi6n

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 4: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

477 103 OBTENCION DE LA ECUACION DE REGRESION MUITIPLE

En la figura 1021 es posible visualizar algunos de los puntos arriba del plano y otros abajo La desviacion de un punto a partir del plano se representa con la siguiente ecuaci6n

(1023)

En la ecuacion 1022 ~o representa el punto donde el plano corta al eje Y es decir representa la interseccion del plano con Y ~1 mide el cambio promedio en Y por unidad de cambio en XI cuando X2 permanece sin cambio y ~2mide el cambio promedio en Y par unidad de cambio en X2 cuand() XI permanece sin cambio Por esta razon ~I y ~2 son los coeficientes de regresi6n parcial

103 OBm~CION DE IA ECUACION DEREGRESION MULTIPLE

Las estimaciones insesgadas de los parametros ~o ~I bullbullbull ~k del modelo especificado en la ecuacion 1021 se obtienen mediante el metodo de los mfnimos ruadrados Esto significa que se minimiza la suma de las dcsviaciones elevadas al cuadrado de los valores observados de Y respecto dela superficie de regresion resultante En el caso de tres variables como se muestraen la figura 1021 la suma de las desviacioshynes al cuadrado de las observaciones respecto del plano es un minimo cuando se estiman ~o ~IY~2 por el metodode mfnimos ruadrados En otras palabras se seleccionan estimaciones de ~o ~J bullbullbull ~k de la muestra en tal forma que la cantidad

es minimizada Esta cantidad que es la suma de los cuadrados residuales tambien puede escribirse como

(1031)

para indicar el hecho de quese minimiza la suma de cuadrados de las desviaciones de los val ores observados dey respecto de los valores de esta variable calculados a partir de la ecuacion estimada

Las estimaciones de los panimetros de regresion multiple se pueden obtener mediante calculos aritmeticoshechos con una calculadora de bolsillo Este metodo para obtener las estimaciones es laborioso consume tiempo esta sujeta a errores y es una perdida de tiempo cuando se dispone de una computadora Aquellos que esten interesados en analizar 0 utilizar el metodo aritmetico pueden consultar las primeras ediciones de este libro 0 las obras de Snedecor y Cochran (1) Y Steel y Torrie (2) quienes ofrecen ejemplosnumericos para cuatro variables Anderson y Bancroft (3) muestran los caIculos involucrados ruando existen cinco variables En el siguiente ejemplo se utilizo el paquete MINITAB para mostrar la aplicacion del analisis de regresion Illultiple

478 CAPiTuLO 10 REGRESION Y CORRELACION MULTIPLE

FJEMPLO 1031

Kalow y Tang (A-I) condujeron un estudio para establecer la variaci6n de las actividades del citocromo P-450IA2 determinada mediante la cafeina en una poshyblaci6n de voluntarios sanos EI segundo objetivo del estudio era comparar la variaci6n en fumadores contra la mayorfa de no fumadores de la poblaci6n Los individuos respondieron a los carteles colocados en el edificio de ciencias medishycas de unauniversidad Las variables sobre las que el investigador recolect6 datos fueron 1)- indice deP-450IA2 (Indice IA2) 2) numero de cigarros fumados por dia (Cigdfa) y 3) nivel de cotihina urinaria (Cot) Las mediciones de estas tres variables para 19 individuos semuestran en la tabla 1031 Se pretende obtener la ecuaci6n de regresi6n multiple

Soluci6n Se ingresan las observaciones de las variables Cigldfa Cot e Indice IA2 en cl c2 y c3 y se les nombra Xl X2 Y Y respectivamente La caja de dialoshygo MINITAB el comando de la sesi6n y lasalida se muestra en la figura

TABlA 1031 Ntimero de cigarros fumados por dia nivel de cotinina urinaria e indice de P~450IA2para

19 individuos descritos en el ejemplo 1031

Cigdia Cot Indice 1A2

1 0000 41648 1 0000 37314 1 0000 57481 1 0000 44370 1 0000 64687 3 0000 38923 8 105950 52952 8 46154 46031 8 271902 58112 8 55319 36890 8 27778 33722

10 197856 80213 10 228045 108367 15 0000 41148 15 145193 55429 15 367113 113531 20 212267 75637 20 211273 72158 24 632125 135000

FUENTE UtiIizada con autorizaci6n de Werner Kalow

419 103 OBTENCION DE LA ECUACIONDE REGRESION MULTIPLE

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Regression MTB gt Name C4 SRES1 Teclear Yen Response y Xl X2 CS = FITS1 C6 = RESI1 en Predictors MTB gt Regress y 2 xl x2 Verificar Residuals SUBCgt SResiduals SRES1 i Verificar Standard resids SUBCgt Fits FITS1 ClicOK SUBCgt Constant

SUBCgt Residuals RESI1

Resultados

Regression Analysis The regression equation is y = 452 00517 xl + 0170 x2

Predictor Coef Stdev t-ratio p Constant 45234 05381 841 0000 xl -005169 006950 074 0468 x2 017020 003013 565 0000

s 1390 R-sq =793 R-sq(adj) = 767

Analysis of Variance

SOURCE DF SS MS F P Regression 2 118060 59030 3056 0000 Error 16 30911 1932 Total 18 148971

SOURCE DF SEQ SS xl 1 56403 x2 1 61658

Unusual Observationns Obs xl y Fit StdevFit Residual StResid

9 80 5 811 8738 0589 -2926 -232R 13 100 10837 7888 0409 2949 222R 19 240 13500 14042 1043 -0542 -059X

R denotes an obs with a large st resid X denotes an obs whose X value gives it large influence

FIGURA 1031 Procedimiento MINITAB Y resultados para el ejemplo 103 L

480 CAPITULO 10 REGRESION Y CQRRELACION MULTIPLE

Sistema SAS

Model MODELl Dependent Variable IA2

Analysis of variance

Sum of Mean

Source DF Squares Square F Value ProbgtF

Model 2 11806041 5903020 30555 00001 Error 16 3091080 1 93192

C Total 18 14897121

Root MSE 1 38994 R-square 07925 Dep Mean 628217 Adj R-sq 07666 CV 2212510

Parameter Estimates

Parameter Standard T for HO Variable DF Estimate Error Parameter=O Prob gt ITI

INTERCEP 1 4523383 053806674 8407 00001

COT 1 0170201 003012742 5649 00001 CIGDAY 1 -0051693 006950225 0744 04678

FIGURA 1032 Resultados producidos por el paquete SASreg para el ejemplo 1031

1031 A partir de los resultados se observa que la ecuaci6n de regresi6n multiple en la notaci6n de la secci6n 102 es

y = 45234-05169x1j +17020x2j

En las secciones siguientes se estudian otros ejemplos En la figura 1032 se muestran los resultados del paquete SAS

para el ejemplo 1031 bull

Despues de obtener la ecuaci6n de regresi6n multiple el siguiente paso es evaluar e interpretar En la siguiente secci6n se cubre esta faceta del amHisis

EJERCICIOS 481

FJERCICIOS

Obtenga la ecuaci6n de regresi6n para cada uno de los siguientes con juntos de datos

1031 Los individuos estudiados por Malec et al (A-2) fueron 16 graduados de un programa inteshygral de rehabilitaci6n de lesiones cerebrales postagudas Los investigadores examinaron las relaciones entre diversas variables que induian el resultado de trabajo (la escala iba de I para desempleado hasta 5 que representa empleo competitivo sin prestaciones) la calificaci6n al momento de la evaluaci6n inicial sobre el inventario de adaptabilidad Portland (PAl por sus siglas en Ingles) y el tiempo de permanencia en dfas Las mediciones registradas sobre estas tres variables son las siguientes

y XI

Resultado Tiempode x2 del permanencia PAl trabajo (dias) PRE

5 67 19 4 157 17 2 242 23 4 255 14 1 227 27 4 140 22 1 179 23 4 258 18 4 85 16 5 52 22 3 296 15 1 256 30 4 198 21 1 224 22 4 126 19 4 156 8

FUENn Utilizada con autorizaci6n deJames Malec PhD

1032 David y Riley (A-3) examinaron los factores cognoscitivos medidos con la prueba de nivel cognoscitivo de Allen (ACL por sus siglas en Ingles) y la relaci6n de la prueba con el nive de psicopatologfa Los individuos estudiados eran pacientes de la unidad de psiquiatrfa del Hospital GeneraL Entre las variables sobre las que trabajaron los investigadores ademas del ACL estaban las calificaciones sobre el vocabulario (V) y la abstracci6n (A) componenshytes del Instituto Shipley de la escala de vida y las calificaciones sobre la prueba de modalishydades de simbologia digital (PMSD) Se registraron las siguientes mediciones en 69 pacientes La variable dependiente es ACL

Individuo ACL PMSD V A

432 CAPITULO 10 REGRESI6N Y CORRELACI6N MULTIPLE

Individuo ACL PMSD V A

1 60 70 2 54 49 3 47 28 4 48 47 5 49 29 6 45 23 7 63 40 8 59 50 9 41 32

10 48 27 11 40 33 12 45 40 13 58 66 14 60 46 15 45 26 16 47 42

28 34 19 32 22 24 24 18 31 14 24 34 29 27 15 31

36 32 8

28 4

24 12 14 20

8 8

36 20 34 10 24

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

59 47 47 38 60 56 48 58 45 48 47 45 60 56 63 52

42 52 35 41 58 41 13 62 46 52 63 42 66 55 55 43

30 17 26 18 32 19 14 27 21 26 22 22 30 26 22 22

26 26 28 26 16 10 36 20 28 14 26 26 26 28 28

Individuo ACL PMSD V A

10 36 30 16 8 2

32 36 18 18 20 8

30 6 6 8 6 8

22 FUENTE Utilizada con autorizaci6n de Sandra K David OTRL

1033 En un estudio acerca de la percepcion de los posibles facto res relacionados con los patrones de admision en un gran hospital un administrador obtuvo estos datos a partir de 10 comushynidades dentro del area de captacion del hospital

16 32 26 11 18 14 30 30 31 23 28 17 31 12 18 23 22 13 30

Individuo ACL PMSD V A

52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

45 49 42 45 48 60 40 45 40 47 60 45 48 66 41 45 66 49

33 48 34 58 35 48 36 37 37 45 38 49 39 50 40 39 41 37 42 56 43 48 44 56 45 66 46 43 47 40 48 42 49 56 50 34 51 40

48 47 50 29 17 39 31 61 45 56 53 29 63 19 23 40 20

2 41

44 51 37 56 37 76 42 20 48 54 53 39 35 63 17 44 47 35

29 28 20 32 33 26 26 13 27 40 25 20 26 26 16 31 30 10

24 36 8

36 36 20 8

10 16 40 32

8 10 30 16 24 36 19

EJERCICIOS 483

Personas por cada 1000 Indice de disponibilidad internadas durante el de otros servicios de Indice de

periodo de estudio salud indigencia Comunidad (Y) (Xl) (X2)

1 616 60 63 2 532 44 55 3 655 91 36 4 649 81 58 5 727 97 68 6 522 48 79 7 502 76 42 8 440 44 60 9 538 91 28 10 535 67 67

Total 5716 699 556

1034 El administrador de un hospital general obtuvo los siguientes datos de 20 pacientes interveshynidos quirurgicamente durante un estudio para determinar que factores parecen estar relashycionados con eI tiempo de hospitalizacion

Tiempo de permanencia Numero de problemas Tiempo de permanencia posoperatoria en dias (Y) medicos actualmente (Xl) preoperatoria en dias (X2)

6 1 1 6 2 1

11 2 2 9 1 3

16 3 3 16 1 5 4 1 1 8 3 1

11 2 2 13 3 2 13 1 4 9 1 2

17 3 3 17 2 4 12 4 1 6 1 1 5 1 1

12 3 2 8 1 2 9 2 2

Total 208 38 43

484 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

1035 Una muestra aleatoria de 25 enfermeras seleccionadas de un directorio de enfermeras generales produjo la siguiente informaci6n respecto a la calificaci6n del examen de colocaci6n de cada una de elIas realizado por la direcci6n estatal de personal (en Estados Unidos) y la calificaci6n final de graduaci6n escolar Ambas calificaciones se relacionan con el area de afiliaci6n de las enfermeras Ademas se tuvo informaci6n de las calificaciones obtenidas por cada enfermera en una prueba de aptitud realizada al ingresar a la escuela de enfermeria Los datos completos son los siguientes

Calificaci6n de aprobaci6n Calificaci6n de la por el estado (Y) Calificaci6n final (Xl) prueba de aptitud (X

2)

440 87 92 480 87 79 535 87 99 460 88 91 525 88 84 480 89 71 510 89 78 530 89 78 545 89 71 600 89 76 495 90 89 545 90 90 575 90 73 525 91 71 575 91 81 600 91 84 490 92 70 510 92 85 575 92 71 540 93 76 595 93 90 525 94 94 545 94 94 600 94 93 625 94 73

Total 13425 2263 2053

1036 Se registraron los siguientes datos para una muestra aleatoria simple de 20 pacientes con hipertensi6n Las variables son

Y presi6n arterial sanguinea media (mm Hg)

XI edad (en afios)

X2 peso (kg)

X3 = area de la superficie corporal (m2)

X4

duraci6n de la hipertensi6n (afios)

X5 pulso basico (latidosmin)

X6 medici6n del estres

104 EVAIUACION DE LA ECUACION DE REGRESION MULTIPLE 485

Paciente Y Xl X2 X3 X4 X5 X6

1 105 47 854 175 51 63 33 2 115 49 942 210 38 70 14 3 116 49 953 198 82 72 10 4 117 50 947 201 58 73 99 5 112 51 894 189 70 72 95 6 121 48 995 225 93 71 10 7 121 49 998 225 25 69 42 8 110 47 909 190 62 66 8 9 110 49 892 183 71 69 62

10 114 48 927 207 56 64 35 11 114 47 944 207 53 74 90 12 115 49 941 198 56 71 21 13 114 50 916 205 102 68 47 14 106 45 871 192 56 67 80 15 125 52 1013 219 100 76 98 16 114 46 945 198 74 69 95 17 106 46 870 187 36 62 18 18 113 46 945 190 43 70 12 19 110 48 905 188 90 71 99 20 122 56 957 209 70 75 99

104 EVALUACION DE L ECUACION DE REGRESION MULTIPLE

Antes de utilizar una ecuaci6n de regresi6n multiple para predicci6n y estimaci6n es conveniente determinar primero si de hecho vale la pena utilizarla AI estudiar la regresi6n lineal simple se aprendi6 que puede evaluarse la utili dad de una ecuaci6n de regresi6n considerando el coeficiente de determinaci6n de la muestra y la penshydiente estimada AI evaluar la ecuaci6n de regresi6n multiple la atenci6n se centra en el coeficiente de determinaci6n multiple y los coeficientes de regresi6n parciales

El coeficiente de determinacion mUltiple En el capitulo 9 se estudia con detalle el coeficiente de determinaci6n El concepto se extiende 16gicamente al caso de la regresi6n multiple La variacion total presente en los valores de Y puede dividirshyse en dos componentes la variaci6n explicada que mide la cantidad de la variaci6n total que es explicada por la superficie de regresi6n ajustada y la variaci6n inexplicashyda que es aquella parte de la variaci6n total que no es explicada por el ajuste de la superficie de regresion La medida de la variaci6n en cada caso es una suma de desshyviaciones elevadas al cuadrado La variaci6n total es la surna de desviaciones al cuashydrado de cada observaci6n de Ya partir de la media de las observaciones y se designa por 2(Yj - y)2 0 SC

tata] La variaci6n explicada designada por 2(yj )1)2 es la surna

de las desviaciones al cuadrado de los valores calculados a partir de la media de los val ores de Y observados Esta suma de desviaciones al cuadrado es la suma de cuadrashy

486 CAPITULO 10 REGRESIONY CORRELACION MULTIPLE

dos debida a la regresi6n (SCR) La variacion inexplicada escrita como 2(Yj y)2es la

suma de las desviaciones al cuadrado de las observaciones originales a partir de los valores calculados A esta cantidad se Ie conoce tambien como la suma de cuadrados en torno a la regresiOn 0 la suma del cuadrado de los errores (SCE) Se puede resumir la relashycion entre las tres sumas de cuadrados con la siguiente ecuacion

L(Yj W L(Yj - W + L(Yj - Yj)2 (1041)

SCwtal = SCR + SCE

suma total de cuadrados = suma de cuadrados explicados (debido a la regresion) + suma de cuadrados no explicados (de los errores)

El coeficiente de determinacion multiple R12 k se obtiene al dividir la suma de cuadrados explicados entre la suma total de cuadrados Esto es

R2 = L(Yj - y)2 (1042)y12 L(Yj _ y)2

El subindice y12 k nos seiiala que en el analisis Yes tratada como variable dependiente y que las variables desde Xl hasta X

k son tratadas como variables indeshy

pendientes EI valor de R12k indica que proporcion del total de variacion en los valores de Y observados es explicada por la regresion de Y sobre XI X

2 bull bull X En

otras palabras se dice que R12 k es una medida de bondad de ajuste de la superfishycie de regresion Esta cantidad es analoga a r2 calculada en el capitulo 9

FJEMPLO 1041

Con suite el ejercicio 1031 Ycalcule R12

Solndon Para el ejemplo se tiene en la figura 1031 que

SC = 1489671total

SCR = 118060 SCE 30911

R212 = 118060 = 7925 7930 y 148971

Se puede decir que aproximadamente 793 por ciento del total de la variacion en los valores de Y se explica a traves del plano de regresion ajustado es decir a traves de la relacion lineal con Xl y X2bull bull

Prueba de hip6tesis de ta regresi6n Para determinar si la regresion comshypleta es significativa (es decir para determinar si R212 es trascendente) se puede aplicar la prueba de hipotesis como sigue Y

1 Datos La situacion de la investigacion y los datos generados por el investishygador se examinan para determinar si la regresion multiple es una tecnica

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 487

TABlA 1041 Tabla NOVA para la regresion multiple

Fuente SC gl CM Rv

Debido a la regresi6n Respecto a la regresi6n

SCR SCE

k n-k-l

CMR SCRk CME = SCE(n-k-l)

CMRCME

Total SCtotal

n 1

2 Supuestos Se considera que el modelo de regresi6n multiple y las suposishyciones basicas tal como se presentan en la secci6n 102 son ap1icables

3 Hipotesis En general la hip6tesis nula es Ho P = P == P = Ph 0 y l 2 3 la hip6tesis alternativa es H

A no todas las Pi = O En palabras la hip6tesis nula

afrrma que todas las variables independientes carecen de valor para explicar la variaci6n enlos valores de Y

4 Estadistica de prueba La estadfstica de prueba conveniente es RY que se calcula como parte del analisis de la variancia La tabla AN OVA se muestra en la tabla 10041 En la tabla 10041 CMR simboliza el cuadrado medio debido a la regresi6n y CME simboliza el cuadrado medio respecto a la regresi6n 0

como algunas veces se Ie llama el cuadrado medio del error

5 Distribuci6n de la estadistica de prueba Cuando Ho es verdadera y se cumshyplen las suposiciones RY sigue una distribuci6n F con k y n - k - 1 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de RY es mayor 0

igual que el valor cdtico de F

7 Ca1cular la estadfstica de prueba Vease la tabla 1004 I

8 Decision estadistica Se rechaza 0 no se rechaza Ho de acuerdo con la regIa de decisi6n

9 Conclusion Si se rechaza Ho se concluye que en la poblacion de la que se extr~io la muestra la variable dependiente esta relacionada en forma lineal con las variables independientes como un solo grupo Si no se rechazaHose conshycluye que en la poblacion no existe relacion lineal entre la variable depenshydiente y las variables independientes como un solo grupo

10 El valor de p Se obtiene e1 valorp a partir de la tabla para la distribuci6n F

Con el siguiente ejemplo se muestra el procedimiento de la prueba de hipotesis

F~EMPLO 1042

Se pretende probar la hipotesis nula de que no hay relacion lineal entre las tres variables analizadas en e1 ejemplo 1031 1-450IA2 el numero de cigarros fumados por dfa y el nive1 de cotinina urinaria

Solucion

1 Datos Vease la descripcion de los datos dados en el ejemplo 1031

488 CAPITULO 10 REGRESION Y CORRELACION ~nJLTIPLE

2 Supuestos Se supone que las consideraciones analizadas en la secci6n 102 se cumplen

3 Hipotesis

Ho 13 = 132 0

H A no todas las 13i = 0

4 Estadistica de prueba La estadistica de prueba es Rv 5 Distribucion de Ia prueba estadistica Si Ho es verdadera y las

suposiciones se cumplen la estadistica de prueba sigue una distrishybuci6n F con 2 como numerador y 16 como denominador para los grados de libertad

6 RegIa de decision Se utiliza un nivel trascendente de a OL Por 10 tanto la regIa de decisi6n rechaza Ho si el valor calculado de RV es mayor 0 igual que 623

7 Calculo de la estadistica de prueba En la FIgura 1031 se muesshytra la tabla ANOVA para este ejemplo en la cual se puede ver que RV es igual a 3056

8 Decision estadistica Puesto que 3056 es mayor que 623 se reshychaza Ho

9 Conclusion Se concluye que en la poblaci6n de la cual se extrashyjo la muestra existe relaci6n lineal entre las tres variables

10 Valor de p Puesto que 3056 es mayor que 751 el valor de p para la prueba es menor que 005 bull

Inferencias con respecto a las f3 individuales Por 10 general se pretenshyde evaluar la fuerza de la relaci6n lineal entre Y y las variables independientes de manera individual Es decir se pretende probar la hip6tesis nula 13i 0 contra la hip6tesis alternativa 13

i 0 ( i 12 k) La validez de este procedimiento se apoya

en las suposiciones establecidas previamente para cada combinaci6n de los valores de Xi existe una subpoblaci6n de valores de Y que siguen una distribuci6n nonnal con variancia a2bull

Prueba de hip6tesis para las f3t Para probar la hip6tesis nula de que es igual a algful valor en particular por ejemplo 130 es posible calcular la estadfstica de t

t (1043)

donde los grados de libertad son igual an - k - 1 Y es la desviaci6n estandar de las b

Las desviaciones estandar de las b estan dadas como parte de los resultados de la mayorfa de paquetes de software para computadora que hacen analisis de regresi6n

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 5: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

478 CAPiTuLO 10 REGRESION Y CORRELACION MULTIPLE

FJEMPLO 1031

Kalow y Tang (A-I) condujeron un estudio para establecer la variaci6n de las actividades del citocromo P-450IA2 determinada mediante la cafeina en una poshyblaci6n de voluntarios sanos EI segundo objetivo del estudio era comparar la variaci6n en fumadores contra la mayorfa de no fumadores de la poblaci6n Los individuos respondieron a los carteles colocados en el edificio de ciencias medishycas de unauniversidad Las variables sobre las que el investigador recolect6 datos fueron 1)- indice deP-450IA2 (Indice IA2) 2) numero de cigarros fumados por dia (Cigdfa) y 3) nivel de cotihina urinaria (Cot) Las mediciones de estas tres variables para 19 individuos semuestran en la tabla 1031 Se pretende obtener la ecuaci6n de regresi6n multiple

Soluci6n Se ingresan las observaciones de las variables Cigldfa Cot e Indice IA2 en cl c2 y c3 y se les nombra Xl X2 Y Y respectivamente La caja de dialoshygo MINITAB el comando de la sesi6n y lasalida se muestra en la figura

TABlA 1031 Ntimero de cigarros fumados por dia nivel de cotinina urinaria e indice de P~450IA2para

19 individuos descritos en el ejemplo 1031

Cigdia Cot Indice 1A2

1 0000 41648 1 0000 37314 1 0000 57481 1 0000 44370 1 0000 64687 3 0000 38923 8 105950 52952 8 46154 46031 8 271902 58112 8 55319 36890 8 27778 33722

10 197856 80213 10 228045 108367 15 0000 41148 15 145193 55429 15 367113 113531 20 212267 75637 20 211273 72158 24 632125 135000

FUENTE UtiIizada con autorizaci6n de Werner Kalow

419 103 OBTENCION DE LA ECUACIONDE REGRESION MULTIPLE

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Regression MTB gt Name C4 SRES1 Teclear Yen Response y Xl X2 CS = FITS1 C6 = RESI1 en Predictors MTB gt Regress y 2 xl x2 Verificar Residuals SUBCgt SResiduals SRES1 i Verificar Standard resids SUBCgt Fits FITS1 ClicOK SUBCgt Constant

SUBCgt Residuals RESI1

Resultados

Regression Analysis The regression equation is y = 452 00517 xl + 0170 x2

Predictor Coef Stdev t-ratio p Constant 45234 05381 841 0000 xl -005169 006950 074 0468 x2 017020 003013 565 0000

s 1390 R-sq =793 R-sq(adj) = 767

Analysis of Variance

SOURCE DF SS MS F P Regression 2 118060 59030 3056 0000 Error 16 30911 1932 Total 18 148971

SOURCE DF SEQ SS xl 1 56403 x2 1 61658

Unusual Observationns Obs xl y Fit StdevFit Residual StResid

9 80 5 811 8738 0589 -2926 -232R 13 100 10837 7888 0409 2949 222R 19 240 13500 14042 1043 -0542 -059X

R denotes an obs with a large st resid X denotes an obs whose X value gives it large influence

FIGURA 1031 Procedimiento MINITAB Y resultados para el ejemplo 103 L

480 CAPITULO 10 REGRESION Y CQRRELACION MULTIPLE

Sistema SAS

Model MODELl Dependent Variable IA2

Analysis of variance

Sum of Mean

Source DF Squares Square F Value ProbgtF

Model 2 11806041 5903020 30555 00001 Error 16 3091080 1 93192

C Total 18 14897121

Root MSE 1 38994 R-square 07925 Dep Mean 628217 Adj R-sq 07666 CV 2212510

Parameter Estimates

Parameter Standard T for HO Variable DF Estimate Error Parameter=O Prob gt ITI

INTERCEP 1 4523383 053806674 8407 00001

COT 1 0170201 003012742 5649 00001 CIGDAY 1 -0051693 006950225 0744 04678

FIGURA 1032 Resultados producidos por el paquete SASreg para el ejemplo 1031

1031 A partir de los resultados se observa que la ecuaci6n de regresi6n multiple en la notaci6n de la secci6n 102 es

y = 45234-05169x1j +17020x2j

En las secciones siguientes se estudian otros ejemplos En la figura 1032 se muestran los resultados del paquete SAS

para el ejemplo 1031 bull

Despues de obtener la ecuaci6n de regresi6n multiple el siguiente paso es evaluar e interpretar En la siguiente secci6n se cubre esta faceta del amHisis

EJERCICIOS 481

FJERCICIOS

Obtenga la ecuaci6n de regresi6n para cada uno de los siguientes con juntos de datos

1031 Los individuos estudiados por Malec et al (A-2) fueron 16 graduados de un programa inteshygral de rehabilitaci6n de lesiones cerebrales postagudas Los investigadores examinaron las relaciones entre diversas variables que induian el resultado de trabajo (la escala iba de I para desempleado hasta 5 que representa empleo competitivo sin prestaciones) la calificaci6n al momento de la evaluaci6n inicial sobre el inventario de adaptabilidad Portland (PAl por sus siglas en Ingles) y el tiempo de permanencia en dfas Las mediciones registradas sobre estas tres variables son las siguientes

y XI

Resultado Tiempode x2 del permanencia PAl trabajo (dias) PRE

5 67 19 4 157 17 2 242 23 4 255 14 1 227 27 4 140 22 1 179 23 4 258 18 4 85 16 5 52 22 3 296 15 1 256 30 4 198 21 1 224 22 4 126 19 4 156 8

FUENn Utilizada con autorizaci6n deJames Malec PhD

1032 David y Riley (A-3) examinaron los factores cognoscitivos medidos con la prueba de nivel cognoscitivo de Allen (ACL por sus siglas en Ingles) y la relaci6n de la prueba con el nive de psicopatologfa Los individuos estudiados eran pacientes de la unidad de psiquiatrfa del Hospital GeneraL Entre las variables sobre las que trabajaron los investigadores ademas del ACL estaban las calificaciones sobre el vocabulario (V) y la abstracci6n (A) componenshytes del Instituto Shipley de la escala de vida y las calificaciones sobre la prueba de modalishydades de simbologia digital (PMSD) Se registraron las siguientes mediciones en 69 pacientes La variable dependiente es ACL

Individuo ACL PMSD V A

432 CAPITULO 10 REGRESI6N Y CORRELACI6N MULTIPLE

Individuo ACL PMSD V A

1 60 70 2 54 49 3 47 28 4 48 47 5 49 29 6 45 23 7 63 40 8 59 50 9 41 32

10 48 27 11 40 33 12 45 40 13 58 66 14 60 46 15 45 26 16 47 42

28 34 19 32 22 24 24 18 31 14 24 34 29 27 15 31

36 32 8

28 4

24 12 14 20

8 8

36 20 34 10 24

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

59 47 47 38 60 56 48 58 45 48 47 45 60 56 63 52

42 52 35 41 58 41 13 62 46 52 63 42 66 55 55 43

30 17 26 18 32 19 14 27 21 26 22 22 30 26 22 22

26 26 28 26 16 10 36 20 28 14 26 26 26 28 28

Individuo ACL PMSD V A

10 36 30 16 8 2

32 36 18 18 20 8

30 6 6 8 6 8

22 FUENTE Utilizada con autorizaci6n de Sandra K David OTRL

1033 En un estudio acerca de la percepcion de los posibles facto res relacionados con los patrones de admision en un gran hospital un administrador obtuvo estos datos a partir de 10 comushynidades dentro del area de captacion del hospital

16 32 26 11 18 14 30 30 31 23 28 17 31 12 18 23 22 13 30

Individuo ACL PMSD V A

52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

45 49 42 45 48 60 40 45 40 47 60 45 48 66 41 45 66 49

33 48 34 58 35 48 36 37 37 45 38 49 39 50 40 39 41 37 42 56 43 48 44 56 45 66 46 43 47 40 48 42 49 56 50 34 51 40

48 47 50 29 17 39 31 61 45 56 53 29 63 19 23 40 20

2 41

44 51 37 56 37 76 42 20 48 54 53 39 35 63 17 44 47 35

29 28 20 32 33 26 26 13 27 40 25 20 26 26 16 31 30 10

24 36 8

36 36 20 8

10 16 40 32

8 10 30 16 24 36 19

EJERCICIOS 483

Personas por cada 1000 Indice de disponibilidad internadas durante el de otros servicios de Indice de

periodo de estudio salud indigencia Comunidad (Y) (Xl) (X2)

1 616 60 63 2 532 44 55 3 655 91 36 4 649 81 58 5 727 97 68 6 522 48 79 7 502 76 42 8 440 44 60 9 538 91 28 10 535 67 67

Total 5716 699 556

1034 El administrador de un hospital general obtuvo los siguientes datos de 20 pacientes interveshynidos quirurgicamente durante un estudio para determinar que factores parecen estar relashycionados con eI tiempo de hospitalizacion

Tiempo de permanencia Numero de problemas Tiempo de permanencia posoperatoria en dias (Y) medicos actualmente (Xl) preoperatoria en dias (X2)

6 1 1 6 2 1

11 2 2 9 1 3

16 3 3 16 1 5 4 1 1 8 3 1

11 2 2 13 3 2 13 1 4 9 1 2

17 3 3 17 2 4 12 4 1 6 1 1 5 1 1

12 3 2 8 1 2 9 2 2

Total 208 38 43

484 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

1035 Una muestra aleatoria de 25 enfermeras seleccionadas de un directorio de enfermeras generales produjo la siguiente informaci6n respecto a la calificaci6n del examen de colocaci6n de cada una de elIas realizado por la direcci6n estatal de personal (en Estados Unidos) y la calificaci6n final de graduaci6n escolar Ambas calificaciones se relacionan con el area de afiliaci6n de las enfermeras Ademas se tuvo informaci6n de las calificaciones obtenidas por cada enfermera en una prueba de aptitud realizada al ingresar a la escuela de enfermeria Los datos completos son los siguientes

Calificaci6n de aprobaci6n Calificaci6n de la por el estado (Y) Calificaci6n final (Xl) prueba de aptitud (X

2)

440 87 92 480 87 79 535 87 99 460 88 91 525 88 84 480 89 71 510 89 78 530 89 78 545 89 71 600 89 76 495 90 89 545 90 90 575 90 73 525 91 71 575 91 81 600 91 84 490 92 70 510 92 85 575 92 71 540 93 76 595 93 90 525 94 94 545 94 94 600 94 93 625 94 73

Total 13425 2263 2053

1036 Se registraron los siguientes datos para una muestra aleatoria simple de 20 pacientes con hipertensi6n Las variables son

Y presi6n arterial sanguinea media (mm Hg)

XI edad (en afios)

X2 peso (kg)

X3 = area de la superficie corporal (m2)

X4

duraci6n de la hipertensi6n (afios)

X5 pulso basico (latidosmin)

X6 medici6n del estres

104 EVAIUACION DE LA ECUACION DE REGRESION MULTIPLE 485

Paciente Y Xl X2 X3 X4 X5 X6

1 105 47 854 175 51 63 33 2 115 49 942 210 38 70 14 3 116 49 953 198 82 72 10 4 117 50 947 201 58 73 99 5 112 51 894 189 70 72 95 6 121 48 995 225 93 71 10 7 121 49 998 225 25 69 42 8 110 47 909 190 62 66 8 9 110 49 892 183 71 69 62

10 114 48 927 207 56 64 35 11 114 47 944 207 53 74 90 12 115 49 941 198 56 71 21 13 114 50 916 205 102 68 47 14 106 45 871 192 56 67 80 15 125 52 1013 219 100 76 98 16 114 46 945 198 74 69 95 17 106 46 870 187 36 62 18 18 113 46 945 190 43 70 12 19 110 48 905 188 90 71 99 20 122 56 957 209 70 75 99

104 EVALUACION DE L ECUACION DE REGRESION MULTIPLE

Antes de utilizar una ecuaci6n de regresi6n multiple para predicci6n y estimaci6n es conveniente determinar primero si de hecho vale la pena utilizarla AI estudiar la regresi6n lineal simple se aprendi6 que puede evaluarse la utili dad de una ecuaci6n de regresi6n considerando el coeficiente de determinaci6n de la muestra y la penshydiente estimada AI evaluar la ecuaci6n de regresi6n multiple la atenci6n se centra en el coeficiente de determinaci6n multiple y los coeficientes de regresi6n parciales

El coeficiente de determinacion mUltiple En el capitulo 9 se estudia con detalle el coeficiente de determinaci6n El concepto se extiende 16gicamente al caso de la regresi6n multiple La variacion total presente en los valores de Y puede dividirshyse en dos componentes la variaci6n explicada que mide la cantidad de la variaci6n total que es explicada por la superficie de regresi6n ajustada y la variaci6n inexplicashyda que es aquella parte de la variaci6n total que no es explicada por el ajuste de la superficie de regresion La medida de la variaci6n en cada caso es una suma de desshyviaciones elevadas al cuadrado La variaci6n total es la surna de desviaciones al cuashydrado de cada observaci6n de Ya partir de la media de las observaciones y se designa por 2(Yj - y)2 0 SC

tata] La variaci6n explicada designada por 2(yj )1)2 es la surna

de las desviaciones al cuadrado de los valores calculados a partir de la media de los val ores de Y observados Esta suma de desviaciones al cuadrado es la suma de cuadrashy

486 CAPITULO 10 REGRESIONY CORRELACION MULTIPLE

dos debida a la regresi6n (SCR) La variacion inexplicada escrita como 2(Yj y)2es la

suma de las desviaciones al cuadrado de las observaciones originales a partir de los valores calculados A esta cantidad se Ie conoce tambien como la suma de cuadrados en torno a la regresiOn 0 la suma del cuadrado de los errores (SCE) Se puede resumir la relashycion entre las tres sumas de cuadrados con la siguiente ecuacion

L(Yj W L(Yj - W + L(Yj - Yj)2 (1041)

SCwtal = SCR + SCE

suma total de cuadrados = suma de cuadrados explicados (debido a la regresion) + suma de cuadrados no explicados (de los errores)

El coeficiente de determinacion multiple R12 k se obtiene al dividir la suma de cuadrados explicados entre la suma total de cuadrados Esto es

R2 = L(Yj - y)2 (1042)y12 L(Yj _ y)2

El subindice y12 k nos seiiala que en el analisis Yes tratada como variable dependiente y que las variables desde Xl hasta X

k son tratadas como variables indeshy

pendientes EI valor de R12k indica que proporcion del total de variacion en los valores de Y observados es explicada por la regresion de Y sobre XI X

2 bull bull X En

otras palabras se dice que R12 k es una medida de bondad de ajuste de la superfishycie de regresion Esta cantidad es analoga a r2 calculada en el capitulo 9

FJEMPLO 1041

Con suite el ejercicio 1031 Ycalcule R12

Solndon Para el ejemplo se tiene en la figura 1031 que

SC = 1489671total

SCR = 118060 SCE 30911

R212 = 118060 = 7925 7930 y 148971

Se puede decir que aproximadamente 793 por ciento del total de la variacion en los valores de Y se explica a traves del plano de regresion ajustado es decir a traves de la relacion lineal con Xl y X2bull bull

Prueba de hip6tesis de ta regresi6n Para determinar si la regresion comshypleta es significativa (es decir para determinar si R212 es trascendente) se puede aplicar la prueba de hipotesis como sigue Y

1 Datos La situacion de la investigacion y los datos generados por el investishygador se examinan para determinar si la regresion multiple es una tecnica

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 487

TABlA 1041 Tabla NOVA para la regresion multiple

Fuente SC gl CM Rv

Debido a la regresi6n Respecto a la regresi6n

SCR SCE

k n-k-l

CMR SCRk CME = SCE(n-k-l)

CMRCME

Total SCtotal

n 1

2 Supuestos Se considera que el modelo de regresi6n multiple y las suposishyciones basicas tal como se presentan en la secci6n 102 son ap1icables

3 Hipotesis En general la hip6tesis nula es Ho P = P == P = Ph 0 y l 2 3 la hip6tesis alternativa es H

A no todas las Pi = O En palabras la hip6tesis nula

afrrma que todas las variables independientes carecen de valor para explicar la variaci6n enlos valores de Y

4 Estadistica de prueba La estadfstica de prueba conveniente es RY que se calcula como parte del analisis de la variancia La tabla AN OVA se muestra en la tabla 10041 En la tabla 10041 CMR simboliza el cuadrado medio debido a la regresi6n y CME simboliza el cuadrado medio respecto a la regresi6n 0

como algunas veces se Ie llama el cuadrado medio del error

5 Distribuci6n de la estadistica de prueba Cuando Ho es verdadera y se cumshyplen las suposiciones RY sigue una distribuci6n F con k y n - k - 1 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de RY es mayor 0

igual que el valor cdtico de F

7 Ca1cular la estadfstica de prueba Vease la tabla 1004 I

8 Decision estadistica Se rechaza 0 no se rechaza Ho de acuerdo con la regIa de decisi6n

9 Conclusion Si se rechaza Ho se concluye que en la poblacion de la que se extr~io la muestra la variable dependiente esta relacionada en forma lineal con las variables independientes como un solo grupo Si no se rechazaHose conshycluye que en la poblacion no existe relacion lineal entre la variable depenshydiente y las variables independientes como un solo grupo

10 El valor de p Se obtiene e1 valorp a partir de la tabla para la distribuci6n F

Con el siguiente ejemplo se muestra el procedimiento de la prueba de hipotesis

F~EMPLO 1042

Se pretende probar la hipotesis nula de que no hay relacion lineal entre las tres variables analizadas en e1 ejemplo 1031 1-450IA2 el numero de cigarros fumados por dfa y el nive1 de cotinina urinaria

Solucion

1 Datos Vease la descripcion de los datos dados en el ejemplo 1031

488 CAPITULO 10 REGRESION Y CORRELACION ~nJLTIPLE

2 Supuestos Se supone que las consideraciones analizadas en la secci6n 102 se cumplen

3 Hipotesis

Ho 13 = 132 0

H A no todas las 13i = 0

4 Estadistica de prueba La estadistica de prueba es Rv 5 Distribucion de Ia prueba estadistica Si Ho es verdadera y las

suposiciones se cumplen la estadistica de prueba sigue una distrishybuci6n F con 2 como numerador y 16 como denominador para los grados de libertad

6 RegIa de decision Se utiliza un nivel trascendente de a OL Por 10 tanto la regIa de decisi6n rechaza Ho si el valor calculado de RV es mayor 0 igual que 623

7 Calculo de la estadistica de prueba En la FIgura 1031 se muesshytra la tabla ANOVA para este ejemplo en la cual se puede ver que RV es igual a 3056

8 Decision estadistica Puesto que 3056 es mayor que 623 se reshychaza Ho

9 Conclusion Se concluye que en la poblaci6n de la cual se extrashyjo la muestra existe relaci6n lineal entre las tres variables

10 Valor de p Puesto que 3056 es mayor que 751 el valor de p para la prueba es menor que 005 bull

Inferencias con respecto a las f3 individuales Por 10 general se pretenshyde evaluar la fuerza de la relaci6n lineal entre Y y las variables independientes de manera individual Es decir se pretende probar la hip6tesis nula 13i 0 contra la hip6tesis alternativa 13

i 0 ( i 12 k) La validez de este procedimiento se apoya

en las suposiciones establecidas previamente para cada combinaci6n de los valores de Xi existe una subpoblaci6n de valores de Y que siguen una distribuci6n nonnal con variancia a2bull

Prueba de hip6tesis para las f3t Para probar la hip6tesis nula de que es igual a algful valor en particular por ejemplo 130 es posible calcular la estadfstica de t

t (1043)

donde los grados de libertad son igual an - k - 1 Y es la desviaci6n estandar de las b

Las desviaciones estandar de las b estan dadas como parte de los resultados de la mayorfa de paquetes de software para computadora que hacen analisis de regresi6n

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 6: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

419 103 OBTENCION DE LA ECUACIONDE REGRESION MULTIPLE

Caja de dialogo Comandos de la sesi6n

Statgt Regressiongt Regression MTB gt Name C4 SRES1 Teclear Yen Response y Xl X2 CS = FITS1 C6 = RESI1 en Predictors MTB gt Regress y 2 xl x2 Verificar Residuals SUBCgt SResiduals SRES1 i Verificar Standard resids SUBCgt Fits FITS1 ClicOK SUBCgt Constant

SUBCgt Residuals RESI1

Resultados

Regression Analysis The regression equation is y = 452 00517 xl + 0170 x2

Predictor Coef Stdev t-ratio p Constant 45234 05381 841 0000 xl -005169 006950 074 0468 x2 017020 003013 565 0000

s 1390 R-sq =793 R-sq(adj) = 767

Analysis of Variance

SOURCE DF SS MS F P Regression 2 118060 59030 3056 0000 Error 16 30911 1932 Total 18 148971

SOURCE DF SEQ SS xl 1 56403 x2 1 61658

Unusual Observationns Obs xl y Fit StdevFit Residual StResid

9 80 5 811 8738 0589 -2926 -232R 13 100 10837 7888 0409 2949 222R 19 240 13500 14042 1043 -0542 -059X

R denotes an obs with a large st resid X denotes an obs whose X value gives it large influence

FIGURA 1031 Procedimiento MINITAB Y resultados para el ejemplo 103 L

480 CAPITULO 10 REGRESION Y CQRRELACION MULTIPLE

Sistema SAS

Model MODELl Dependent Variable IA2

Analysis of variance

Sum of Mean

Source DF Squares Square F Value ProbgtF

Model 2 11806041 5903020 30555 00001 Error 16 3091080 1 93192

C Total 18 14897121

Root MSE 1 38994 R-square 07925 Dep Mean 628217 Adj R-sq 07666 CV 2212510

Parameter Estimates

Parameter Standard T for HO Variable DF Estimate Error Parameter=O Prob gt ITI

INTERCEP 1 4523383 053806674 8407 00001

COT 1 0170201 003012742 5649 00001 CIGDAY 1 -0051693 006950225 0744 04678

FIGURA 1032 Resultados producidos por el paquete SASreg para el ejemplo 1031

1031 A partir de los resultados se observa que la ecuaci6n de regresi6n multiple en la notaci6n de la secci6n 102 es

y = 45234-05169x1j +17020x2j

En las secciones siguientes se estudian otros ejemplos En la figura 1032 se muestran los resultados del paquete SAS

para el ejemplo 1031 bull

Despues de obtener la ecuaci6n de regresi6n multiple el siguiente paso es evaluar e interpretar En la siguiente secci6n se cubre esta faceta del amHisis

EJERCICIOS 481

FJERCICIOS

Obtenga la ecuaci6n de regresi6n para cada uno de los siguientes con juntos de datos

1031 Los individuos estudiados por Malec et al (A-2) fueron 16 graduados de un programa inteshygral de rehabilitaci6n de lesiones cerebrales postagudas Los investigadores examinaron las relaciones entre diversas variables que induian el resultado de trabajo (la escala iba de I para desempleado hasta 5 que representa empleo competitivo sin prestaciones) la calificaci6n al momento de la evaluaci6n inicial sobre el inventario de adaptabilidad Portland (PAl por sus siglas en Ingles) y el tiempo de permanencia en dfas Las mediciones registradas sobre estas tres variables son las siguientes

y XI

Resultado Tiempode x2 del permanencia PAl trabajo (dias) PRE

5 67 19 4 157 17 2 242 23 4 255 14 1 227 27 4 140 22 1 179 23 4 258 18 4 85 16 5 52 22 3 296 15 1 256 30 4 198 21 1 224 22 4 126 19 4 156 8

FUENn Utilizada con autorizaci6n deJames Malec PhD

1032 David y Riley (A-3) examinaron los factores cognoscitivos medidos con la prueba de nivel cognoscitivo de Allen (ACL por sus siglas en Ingles) y la relaci6n de la prueba con el nive de psicopatologfa Los individuos estudiados eran pacientes de la unidad de psiquiatrfa del Hospital GeneraL Entre las variables sobre las que trabajaron los investigadores ademas del ACL estaban las calificaciones sobre el vocabulario (V) y la abstracci6n (A) componenshytes del Instituto Shipley de la escala de vida y las calificaciones sobre la prueba de modalishydades de simbologia digital (PMSD) Se registraron las siguientes mediciones en 69 pacientes La variable dependiente es ACL

Individuo ACL PMSD V A

432 CAPITULO 10 REGRESI6N Y CORRELACI6N MULTIPLE

Individuo ACL PMSD V A

1 60 70 2 54 49 3 47 28 4 48 47 5 49 29 6 45 23 7 63 40 8 59 50 9 41 32

10 48 27 11 40 33 12 45 40 13 58 66 14 60 46 15 45 26 16 47 42

28 34 19 32 22 24 24 18 31 14 24 34 29 27 15 31

36 32 8

28 4

24 12 14 20

8 8

36 20 34 10 24

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

59 47 47 38 60 56 48 58 45 48 47 45 60 56 63 52

42 52 35 41 58 41 13 62 46 52 63 42 66 55 55 43

30 17 26 18 32 19 14 27 21 26 22 22 30 26 22 22

26 26 28 26 16 10 36 20 28 14 26 26 26 28 28

Individuo ACL PMSD V A

10 36 30 16 8 2

32 36 18 18 20 8

30 6 6 8 6 8

22 FUENTE Utilizada con autorizaci6n de Sandra K David OTRL

1033 En un estudio acerca de la percepcion de los posibles facto res relacionados con los patrones de admision en un gran hospital un administrador obtuvo estos datos a partir de 10 comushynidades dentro del area de captacion del hospital

16 32 26 11 18 14 30 30 31 23 28 17 31 12 18 23 22 13 30

Individuo ACL PMSD V A

52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

45 49 42 45 48 60 40 45 40 47 60 45 48 66 41 45 66 49

33 48 34 58 35 48 36 37 37 45 38 49 39 50 40 39 41 37 42 56 43 48 44 56 45 66 46 43 47 40 48 42 49 56 50 34 51 40

48 47 50 29 17 39 31 61 45 56 53 29 63 19 23 40 20

2 41

44 51 37 56 37 76 42 20 48 54 53 39 35 63 17 44 47 35

29 28 20 32 33 26 26 13 27 40 25 20 26 26 16 31 30 10

24 36 8

36 36 20 8

10 16 40 32

8 10 30 16 24 36 19

EJERCICIOS 483

Personas por cada 1000 Indice de disponibilidad internadas durante el de otros servicios de Indice de

periodo de estudio salud indigencia Comunidad (Y) (Xl) (X2)

1 616 60 63 2 532 44 55 3 655 91 36 4 649 81 58 5 727 97 68 6 522 48 79 7 502 76 42 8 440 44 60 9 538 91 28 10 535 67 67

Total 5716 699 556

1034 El administrador de un hospital general obtuvo los siguientes datos de 20 pacientes interveshynidos quirurgicamente durante un estudio para determinar que factores parecen estar relashycionados con eI tiempo de hospitalizacion

Tiempo de permanencia Numero de problemas Tiempo de permanencia posoperatoria en dias (Y) medicos actualmente (Xl) preoperatoria en dias (X2)

6 1 1 6 2 1

11 2 2 9 1 3

16 3 3 16 1 5 4 1 1 8 3 1

11 2 2 13 3 2 13 1 4 9 1 2

17 3 3 17 2 4 12 4 1 6 1 1 5 1 1

12 3 2 8 1 2 9 2 2

Total 208 38 43

484 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

1035 Una muestra aleatoria de 25 enfermeras seleccionadas de un directorio de enfermeras generales produjo la siguiente informaci6n respecto a la calificaci6n del examen de colocaci6n de cada una de elIas realizado por la direcci6n estatal de personal (en Estados Unidos) y la calificaci6n final de graduaci6n escolar Ambas calificaciones se relacionan con el area de afiliaci6n de las enfermeras Ademas se tuvo informaci6n de las calificaciones obtenidas por cada enfermera en una prueba de aptitud realizada al ingresar a la escuela de enfermeria Los datos completos son los siguientes

Calificaci6n de aprobaci6n Calificaci6n de la por el estado (Y) Calificaci6n final (Xl) prueba de aptitud (X

2)

440 87 92 480 87 79 535 87 99 460 88 91 525 88 84 480 89 71 510 89 78 530 89 78 545 89 71 600 89 76 495 90 89 545 90 90 575 90 73 525 91 71 575 91 81 600 91 84 490 92 70 510 92 85 575 92 71 540 93 76 595 93 90 525 94 94 545 94 94 600 94 93 625 94 73

Total 13425 2263 2053

1036 Se registraron los siguientes datos para una muestra aleatoria simple de 20 pacientes con hipertensi6n Las variables son

Y presi6n arterial sanguinea media (mm Hg)

XI edad (en afios)

X2 peso (kg)

X3 = area de la superficie corporal (m2)

X4

duraci6n de la hipertensi6n (afios)

X5 pulso basico (latidosmin)

X6 medici6n del estres

104 EVAIUACION DE LA ECUACION DE REGRESION MULTIPLE 485

Paciente Y Xl X2 X3 X4 X5 X6

1 105 47 854 175 51 63 33 2 115 49 942 210 38 70 14 3 116 49 953 198 82 72 10 4 117 50 947 201 58 73 99 5 112 51 894 189 70 72 95 6 121 48 995 225 93 71 10 7 121 49 998 225 25 69 42 8 110 47 909 190 62 66 8 9 110 49 892 183 71 69 62

10 114 48 927 207 56 64 35 11 114 47 944 207 53 74 90 12 115 49 941 198 56 71 21 13 114 50 916 205 102 68 47 14 106 45 871 192 56 67 80 15 125 52 1013 219 100 76 98 16 114 46 945 198 74 69 95 17 106 46 870 187 36 62 18 18 113 46 945 190 43 70 12 19 110 48 905 188 90 71 99 20 122 56 957 209 70 75 99

104 EVALUACION DE L ECUACION DE REGRESION MULTIPLE

Antes de utilizar una ecuaci6n de regresi6n multiple para predicci6n y estimaci6n es conveniente determinar primero si de hecho vale la pena utilizarla AI estudiar la regresi6n lineal simple se aprendi6 que puede evaluarse la utili dad de una ecuaci6n de regresi6n considerando el coeficiente de determinaci6n de la muestra y la penshydiente estimada AI evaluar la ecuaci6n de regresi6n multiple la atenci6n se centra en el coeficiente de determinaci6n multiple y los coeficientes de regresi6n parciales

El coeficiente de determinacion mUltiple En el capitulo 9 se estudia con detalle el coeficiente de determinaci6n El concepto se extiende 16gicamente al caso de la regresi6n multiple La variacion total presente en los valores de Y puede dividirshyse en dos componentes la variaci6n explicada que mide la cantidad de la variaci6n total que es explicada por la superficie de regresi6n ajustada y la variaci6n inexplicashyda que es aquella parte de la variaci6n total que no es explicada por el ajuste de la superficie de regresion La medida de la variaci6n en cada caso es una suma de desshyviaciones elevadas al cuadrado La variaci6n total es la surna de desviaciones al cuashydrado de cada observaci6n de Ya partir de la media de las observaciones y se designa por 2(Yj - y)2 0 SC

tata] La variaci6n explicada designada por 2(yj )1)2 es la surna

de las desviaciones al cuadrado de los valores calculados a partir de la media de los val ores de Y observados Esta suma de desviaciones al cuadrado es la suma de cuadrashy

486 CAPITULO 10 REGRESIONY CORRELACION MULTIPLE

dos debida a la regresi6n (SCR) La variacion inexplicada escrita como 2(Yj y)2es la

suma de las desviaciones al cuadrado de las observaciones originales a partir de los valores calculados A esta cantidad se Ie conoce tambien como la suma de cuadrados en torno a la regresiOn 0 la suma del cuadrado de los errores (SCE) Se puede resumir la relashycion entre las tres sumas de cuadrados con la siguiente ecuacion

L(Yj W L(Yj - W + L(Yj - Yj)2 (1041)

SCwtal = SCR + SCE

suma total de cuadrados = suma de cuadrados explicados (debido a la regresion) + suma de cuadrados no explicados (de los errores)

El coeficiente de determinacion multiple R12 k se obtiene al dividir la suma de cuadrados explicados entre la suma total de cuadrados Esto es

R2 = L(Yj - y)2 (1042)y12 L(Yj _ y)2

El subindice y12 k nos seiiala que en el analisis Yes tratada como variable dependiente y que las variables desde Xl hasta X

k son tratadas como variables indeshy

pendientes EI valor de R12k indica que proporcion del total de variacion en los valores de Y observados es explicada por la regresion de Y sobre XI X

2 bull bull X En

otras palabras se dice que R12 k es una medida de bondad de ajuste de la superfishycie de regresion Esta cantidad es analoga a r2 calculada en el capitulo 9

FJEMPLO 1041

Con suite el ejercicio 1031 Ycalcule R12

Solndon Para el ejemplo se tiene en la figura 1031 que

SC = 1489671total

SCR = 118060 SCE 30911

R212 = 118060 = 7925 7930 y 148971

Se puede decir que aproximadamente 793 por ciento del total de la variacion en los valores de Y se explica a traves del plano de regresion ajustado es decir a traves de la relacion lineal con Xl y X2bull bull

Prueba de hip6tesis de ta regresi6n Para determinar si la regresion comshypleta es significativa (es decir para determinar si R212 es trascendente) se puede aplicar la prueba de hipotesis como sigue Y

1 Datos La situacion de la investigacion y los datos generados por el investishygador se examinan para determinar si la regresion multiple es una tecnica

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 487

TABlA 1041 Tabla NOVA para la regresion multiple

Fuente SC gl CM Rv

Debido a la regresi6n Respecto a la regresi6n

SCR SCE

k n-k-l

CMR SCRk CME = SCE(n-k-l)

CMRCME

Total SCtotal

n 1

2 Supuestos Se considera que el modelo de regresi6n multiple y las suposishyciones basicas tal como se presentan en la secci6n 102 son ap1icables

3 Hipotesis En general la hip6tesis nula es Ho P = P == P = Ph 0 y l 2 3 la hip6tesis alternativa es H

A no todas las Pi = O En palabras la hip6tesis nula

afrrma que todas las variables independientes carecen de valor para explicar la variaci6n enlos valores de Y

4 Estadistica de prueba La estadfstica de prueba conveniente es RY que se calcula como parte del analisis de la variancia La tabla AN OVA se muestra en la tabla 10041 En la tabla 10041 CMR simboliza el cuadrado medio debido a la regresi6n y CME simboliza el cuadrado medio respecto a la regresi6n 0

como algunas veces se Ie llama el cuadrado medio del error

5 Distribuci6n de la estadistica de prueba Cuando Ho es verdadera y se cumshyplen las suposiciones RY sigue una distribuci6n F con k y n - k - 1 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de RY es mayor 0

igual que el valor cdtico de F

7 Ca1cular la estadfstica de prueba Vease la tabla 1004 I

8 Decision estadistica Se rechaza 0 no se rechaza Ho de acuerdo con la regIa de decisi6n

9 Conclusion Si se rechaza Ho se concluye que en la poblacion de la que se extr~io la muestra la variable dependiente esta relacionada en forma lineal con las variables independientes como un solo grupo Si no se rechazaHose conshycluye que en la poblacion no existe relacion lineal entre la variable depenshydiente y las variables independientes como un solo grupo

10 El valor de p Se obtiene e1 valorp a partir de la tabla para la distribuci6n F

Con el siguiente ejemplo se muestra el procedimiento de la prueba de hipotesis

F~EMPLO 1042

Se pretende probar la hipotesis nula de que no hay relacion lineal entre las tres variables analizadas en e1 ejemplo 1031 1-450IA2 el numero de cigarros fumados por dfa y el nive1 de cotinina urinaria

Solucion

1 Datos Vease la descripcion de los datos dados en el ejemplo 1031

488 CAPITULO 10 REGRESION Y CORRELACION ~nJLTIPLE

2 Supuestos Se supone que las consideraciones analizadas en la secci6n 102 se cumplen

3 Hipotesis

Ho 13 = 132 0

H A no todas las 13i = 0

4 Estadistica de prueba La estadistica de prueba es Rv 5 Distribucion de Ia prueba estadistica Si Ho es verdadera y las

suposiciones se cumplen la estadistica de prueba sigue una distrishybuci6n F con 2 como numerador y 16 como denominador para los grados de libertad

6 RegIa de decision Se utiliza un nivel trascendente de a OL Por 10 tanto la regIa de decisi6n rechaza Ho si el valor calculado de RV es mayor 0 igual que 623

7 Calculo de la estadistica de prueba En la FIgura 1031 se muesshytra la tabla ANOVA para este ejemplo en la cual se puede ver que RV es igual a 3056

8 Decision estadistica Puesto que 3056 es mayor que 623 se reshychaza Ho

9 Conclusion Se concluye que en la poblaci6n de la cual se extrashyjo la muestra existe relaci6n lineal entre las tres variables

10 Valor de p Puesto que 3056 es mayor que 751 el valor de p para la prueba es menor que 005 bull

Inferencias con respecto a las f3 individuales Por 10 general se pretenshyde evaluar la fuerza de la relaci6n lineal entre Y y las variables independientes de manera individual Es decir se pretende probar la hip6tesis nula 13i 0 contra la hip6tesis alternativa 13

i 0 ( i 12 k) La validez de este procedimiento se apoya

en las suposiciones establecidas previamente para cada combinaci6n de los valores de Xi existe una subpoblaci6n de valores de Y que siguen una distribuci6n nonnal con variancia a2bull

Prueba de hip6tesis para las f3t Para probar la hip6tesis nula de que es igual a algful valor en particular por ejemplo 130 es posible calcular la estadfstica de t

t (1043)

donde los grados de libertad son igual an - k - 1 Y es la desviaci6n estandar de las b

Las desviaciones estandar de las b estan dadas como parte de los resultados de la mayorfa de paquetes de software para computadora que hacen analisis de regresi6n

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 7: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

480 CAPITULO 10 REGRESION Y CQRRELACION MULTIPLE

Sistema SAS

Model MODELl Dependent Variable IA2

Analysis of variance

Sum of Mean

Source DF Squares Square F Value ProbgtF

Model 2 11806041 5903020 30555 00001 Error 16 3091080 1 93192

C Total 18 14897121

Root MSE 1 38994 R-square 07925 Dep Mean 628217 Adj R-sq 07666 CV 2212510

Parameter Estimates

Parameter Standard T for HO Variable DF Estimate Error Parameter=O Prob gt ITI

INTERCEP 1 4523383 053806674 8407 00001

COT 1 0170201 003012742 5649 00001 CIGDAY 1 -0051693 006950225 0744 04678

FIGURA 1032 Resultados producidos por el paquete SASreg para el ejemplo 1031

1031 A partir de los resultados se observa que la ecuaci6n de regresi6n multiple en la notaci6n de la secci6n 102 es

y = 45234-05169x1j +17020x2j

En las secciones siguientes se estudian otros ejemplos En la figura 1032 se muestran los resultados del paquete SAS

para el ejemplo 1031 bull

Despues de obtener la ecuaci6n de regresi6n multiple el siguiente paso es evaluar e interpretar En la siguiente secci6n se cubre esta faceta del amHisis

EJERCICIOS 481

FJERCICIOS

Obtenga la ecuaci6n de regresi6n para cada uno de los siguientes con juntos de datos

1031 Los individuos estudiados por Malec et al (A-2) fueron 16 graduados de un programa inteshygral de rehabilitaci6n de lesiones cerebrales postagudas Los investigadores examinaron las relaciones entre diversas variables que induian el resultado de trabajo (la escala iba de I para desempleado hasta 5 que representa empleo competitivo sin prestaciones) la calificaci6n al momento de la evaluaci6n inicial sobre el inventario de adaptabilidad Portland (PAl por sus siglas en Ingles) y el tiempo de permanencia en dfas Las mediciones registradas sobre estas tres variables son las siguientes

y XI

Resultado Tiempode x2 del permanencia PAl trabajo (dias) PRE

5 67 19 4 157 17 2 242 23 4 255 14 1 227 27 4 140 22 1 179 23 4 258 18 4 85 16 5 52 22 3 296 15 1 256 30 4 198 21 1 224 22 4 126 19 4 156 8

FUENn Utilizada con autorizaci6n deJames Malec PhD

1032 David y Riley (A-3) examinaron los factores cognoscitivos medidos con la prueba de nivel cognoscitivo de Allen (ACL por sus siglas en Ingles) y la relaci6n de la prueba con el nive de psicopatologfa Los individuos estudiados eran pacientes de la unidad de psiquiatrfa del Hospital GeneraL Entre las variables sobre las que trabajaron los investigadores ademas del ACL estaban las calificaciones sobre el vocabulario (V) y la abstracci6n (A) componenshytes del Instituto Shipley de la escala de vida y las calificaciones sobre la prueba de modalishydades de simbologia digital (PMSD) Se registraron las siguientes mediciones en 69 pacientes La variable dependiente es ACL

Individuo ACL PMSD V A

432 CAPITULO 10 REGRESI6N Y CORRELACI6N MULTIPLE

Individuo ACL PMSD V A

1 60 70 2 54 49 3 47 28 4 48 47 5 49 29 6 45 23 7 63 40 8 59 50 9 41 32

10 48 27 11 40 33 12 45 40 13 58 66 14 60 46 15 45 26 16 47 42

28 34 19 32 22 24 24 18 31 14 24 34 29 27 15 31

36 32 8

28 4

24 12 14 20

8 8

36 20 34 10 24

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

59 47 47 38 60 56 48 58 45 48 47 45 60 56 63 52

42 52 35 41 58 41 13 62 46 52 63 42 66 55 55 43

30 17 26 18 32 19 14 27 21 26 22 22 30 26 22 22

26 26 28 26 16 10 36 20 28 14 26 26 26 28 28

Individuo ACL PMSD V A

10 36 30 16 8 2

32 36 18 18 20 8

30 6 6 8 6 8

22 FUENTE Utilizada con autorizaci6n de Sandra K David OTRL

1033 En un estudio acerca de la percepcion de los posibles facto res relacionados con los patrones de admision en un gran hospital un administrador obtuvo estos datos a partir de 10 comushynidades dentro del area de captacion del hospital

16 32 26 11 18 14 30 30 31 23 28 17 31 12 18 23 22 13 30

Individuo ACL PMSD V A

52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

45 49 42 45 48 60 40 45 40 47 60 45 48 66 41 45 66 49

33 48 34 58 35 48 36 37 37 45 38 49 39 50 40 39 41 37 42 56 43 48 44 56 45 66 46 43 47 40 48 42 49 56 50 34 51 40

48 47 50 29 17 39 31 61 45 56 53 29 63 19 23 40 20

2 41

44 51 37 56 37 76 42 20 48 54 53 39 35 63 17 44 47 35

29 28 20 32 33 26 26 13 27 40 25 20 26 26 16 31 30 10

24 36 8

36 36 20 8

10 16 40 32

8 10 30 16 24 36 19

EJERCICIOS 483

Personas por cada 1000 Indice de disponibilidad internadas durante el de otros servicios de Indice de

periodo de estudio salud indigencia Comunidad (Y) (Xl) (X2)

1 616 60 63 2 532 44 55 3 655 91 36 4 649 81 58 5 727 97 68 6 522 48 79 7 502 76 42 8 440 44 60 9 538 91 28 10 535 67 67

Total 5716 699 556

1034 El administrador de un hospital general obtuvo los siguientes datos de 20 pacientes interveshynidos quirurgicamente durante un estudio para determinar que factores parecen estar relashycionados con eI tiempo de hospitalizacion

Tiempo de permanencia Numero de problemas Tiempo de permanencia posoperatoria en dias (Y) medicos actualmente (Xl) preoperatoria en dias (X2)

6 1 1 6 2 1

11 2 2 9 1 3

16 3 3 16 1 5 4 1 1 8 3 1

11 2 2 13 3 2 13 1 4 9 1 2

17 3 3 17 2 4 12 4 1 6 1 1 5 1 1

12 3 2 8 1 2 9 2 2

Total 208 38 43

484 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

1035 Una muestra aleatoria de 25 enfermeras seleccionadas de un directorio de enfermeras generales produjo la siguiente informaci6n respecto a la calificaci6n del examen de colocaci6n de cada una de elIas realizado por la direcci6n estatal de personal (en Estados Unidos) y la calificaci6n final de graduaci6n escolar Ambas calificaciones se relacionan con el area de afiliaci6n de las enfermeras Ademas se tuvo informaci6n de las calificaciones obtenidas por cada enfermera en una prueba de aptitud realizada al ingresar a la escuela de enfermeria Los datos completos son los siguientes

Calificaci6n de aprobaci6n Calificaci6n de la por el estado (Y) Calificaci6n final (Xl) prueba de aptitud (X

2)

440 87 92 480 87 79 535 87 99 460 88 91 525 88 84 480 89 71 510 89 78 530 89 78 545 89 71 600 89 76 495 90 89 545 90 90 575 90 73 525 91 71 575 91 81 600 91 84 490 92 70 510 92 85 575 92 71 540 93 76 595 93 90 525 94 94 545 94 94 600 94 93 625 94 73

Total 13425 2263 2053

1036 Se registraron los siguientes datos para una muestra aleatoria simple de 20 pacientes con hipertensi6n Las variables son

Y presi6n arterial sanguinea media (mm Hg)

XI edad (en afios)

X2 peso (kg)

X3 = area de la superficie corporal (m2)

X4

duraci6n de la hipertensi6n (afios)

X5 pulso basico (latidosmin)

X6 medici6n del estres

104 EVAIUACION DE LA ECUACION DE REGRESION MULTIPLE 485

Paciente Y Xl X2 X3 X4 X5 X6

1 105 47 854 175 51 63 33 2 115 49 942 210 38 70 14 3 116 49 953 198 82 72 10 4 117 50 947 201 58 73 99 5 112 51 894 189 70 72 95 6 121 48 995 225 93 71 10 7 121 49 998 225 25 69 42 8 110 47 909 190 62 66 8 9 110 49 892 183 71 69 62

10 114 48 927 207 56 64 35 11 114 47 944 207 53 74 90 12 115 49 941 198 56 71 21 13 114 50 916 205 102 68 47 14 106 45 871 192 56 67 80 15 125 52 1013 219 100 76 98 16 114 46 945 198 74 69 95 17 106 46 870 187 36 62 18 18 113 46 945 190 43 70 12 19 110 48 905 188 90 71 99 20 122 56 957 209 70 75 99

104 EVALUACION DE L ECUACION DE REGRESION MULTIPLE

Antes de utilizar una ecuaci6n de regresi6n multiple para predicci6n y estimaci6n es conveniente determinar primero si de hecho vale la pena utilizarla AI estudiar la regresi6n lineal simple se aprendi6 que puede evaluarse la utili dad de una ecuaci6n de regresi6n considerando el coeficiente de determinaci6n de la muestra y la penshydiente estimada AI evaluar la ecuaci6n de regresi6n multiple la atenci6n se centra en el coeficiente de determinaci6n multiple y los coeficientes de regresi6n parciales

El coeficiente de determinacion mUltiple En el capitulo 9 se estudia con detalle el coeficiente de determinaci6n El concepto se extiende 16gicamente al caso de la regresi6n multiple La variacion total presente en los valores de Y puede dividirshyse en dos componentes la variaci6n explicada que mide la cantidad de la variaci6n total que es explicada por la superficie de regresi6n ajustada y la variaci6n inexplicashyda que es aquella parte de la variaci6n total que no es explicada por el ajuste de la superficie de regresion La medida de la variaci6n en cada caso es una suma de desshyviaciones elevadas al cuadrado La variaci6n total es la surna de desviaciones al cuashydrado de cada observaci6n de Ya partir de la media de las observaciones y se designa por 2(Yj - y)2 0 SC

tata] La variaci6n explicada designada por 2(yj )1)2 es la surna

de las desviaciones al cuadrado de los valores calculados a partir de la media de los val ores de Y observados Esta suma de desviaciones al cuadrado es la suma de cuadrashy

486 CAPITULO 10 REGRESIONY CORRELACION MULTIPLE

dos debida a la regresi6n (SCR) La variacion inexplicada escrita como 2(Yj y)2es la

suma de las desviaciones al cuadrado de las observaciones originales a partir de los valores calculados A esta cantidad se Ie conoce tambien como la suma de cuadrados en torno a la regresiOn 0 la suma del cuadrado de los errores (SCE) Se puede resumir la relashycion entre las tres sumas de cuadrados con la siguiente ecuacion

L(Yj W L(Yj - W + L(Yj - Yj)2 (1041)

SCwtal = SCR + SCE

suma total de cuadrados = suma de cuadrados explicados (debido a la regresion) + suma de cuadrados no explicados (de los errores)

El coeficiente de determinacion multiple R12 k se obtiene al dividir la suma de cuadrados explicados entre la suma total de cuadrados Esto es

R2 = L(Yj - y)2 (1042)y12 L(Yj _ y)2

El subindice y12 k nos seiiala que en el analisis Yes tratada como variable dependiente y que las variables desde Xl hasta X

k son tratadas como variables indeshy

pendientes EI valor de R12k indica que proporcion del total de variacion en los valores de Y observados es explicada por la regresion de Y sobre XI X

2 bull bull X En

otras palabras se dice que R12 k es una medida de bondad de ajuste de la superfishycie de regresion Esta cantidad es analoga a r2 calculada en el capitulo 9

FJEMPLO 1041

Con suite el ejercicio 1031 Ycalcule R12

Solndon Para el ejemplo se tiene en la figura 1031 que

SC = 1489671total

SCR = 118060 SCE 30911

R212 = 118060 = 7925 7930 y 148971

Se puede decir que aproximadamente 793 por ciento del total de la variacion en los valores de Y se explica a traves del plano de regresion ajustado es decir a traves de la relacion lineal con Xl y X2bull bull

Prueba de hip6tesis de ta regresi6n Para determinar si la regresion comshypleta es significativa (es decir para determinar si R212 es trascendente) se puede aplicar la prueba de hipotesis como sigue Y

1 Datos La situacion de la investigacion y los datos generados por el investishygador se examinan para determinar si la regresion multiple es una tecnica

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 487

TABlA 1041 Tabla NOVA para la regresion multiple

Fuente SC gl CM Rv

Debido a la regresi6n Respecto a la regresi6n

SCR SCE

k n-k-l

CMR SCRk CME = SCE(n-k-l)

CMRCME

Total SCtotal

n 1

2 Supuestos Se considera que el modelo de regresi6n multiple y las suposishyciones basicas tal como se presentan en la secci6n 102 son ap1icables

3 Hipotesis En general la hip6tesis nula es Ho P = P == P = Ph 0 y l 2 3 la hip6tesis alternativa es H

A no todas las Pi = O En palabras la hip6tesis nula

afrrma que todas las variables independientes carecen de valor para explicar la variaci6n enlos valores de Y

4 Estadistica de prueba La estadfstica de prueba conveniente es RY que se calcula como parte del analisis de la variancia La tabla AN OVA se muestra en la tabla 10041 En la tabla 10041 CMR simboliza el cuadrado medio debido a la regresi6n y CME simboliza el cuadrado medio respecto a la regresi6n 0

como algunas veces se Ie llama el cuadrado medio del error

5 Distribuci6n de la estadistica de prueba Cuando Ho es verdadera y se cumshyplen las suposiciones RY sigue una distribuci6n F con k y n - k - 1 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de RY es mayor 0

igual que el valor cdtico de F

7 Ca1cular la estadfstica de prueba Vease la tabla 1004 I

8 Decision estadistica Se rechaza 0 no se rechaza Ho de acuerdo con la regIa de decisi6n

9 Conclusion Si se rechaza Ho se concluye que en la poblacion de la que se extr~io la muestra la variable dependiente esta relacionada en forma lineal con las variables independientes como un solo grupo Si no se rechazaHose conshycluye que en la poblacion no existe relacion lineal entre la variable depenshydiente y las variables independientes como un solo grupo

10 El valor de p Se obtiene e1 valorp a partir de la tabla para la distribuci6n F

Con el siguiente ejemplo se muestra el procedimiento de la prueba de hipotesis

F~EMPLO 1042

Se pretende probar la hipotesis nula de que no hay relacion lineal entre las tres variables analizadas en e1 ejemplo 1031 1-450IA2 el numero de cigarros fumados por dfa y el nive1 de cotinina urinaria

Solucion

1 Datos Vease la descripcion de los datos dados en el ejemplo 1031

488 CAPITULO 10 REGRESION Y CORRELACION ~nJLTIPLE

2 Supuestos Se supone que las consideraciones analizadas en la secci6n 102 se cumplen

3 Hipotesis

Ho 13 = 132 0

H A no todas las 13i = 0

4 Estadistica de prueba La estadistica de prueba es Rv 5 Distribucion de Ia prueba estadistica Si Ho es verdadera y las

suposiciones se cumplen la estadistica de prueba sigue una distrishybuci6n F con 2 como numerador y 16 como denominador para los grados de libertad

6 RegIa de decision Se utiliza un nivel trascendente de a OL Por 10 tanto la regIa de decisi6n rechaza Ho si el valor calculado de RV es mayor 0 igual que 623

7 Calculo de la estadistica de prueba En la FIgura 1031 se muesshytra la tabla ANOVA para este ejemplo en la cual se puede ver que RV es igual a 3056

8 Decision estadistica Puesto que 3056 es mayor que 623 se reshychaza Ho

9 Conclusion Se concluye que en la poblaci6n de la cual se extrashyjo la muestra existe relaci6n lineal entre las tres variables

10 Valor de p Puesto que 3056 es mayor que 751 el valor de p para la prueba es menor que 005 bull

Inferencias con respecto a las f3 individuales Por 10 general se pretenshyde evaluar la fuerza de la relaci6n lineal entre Y y las variables independientes de manera individual Es decir se pretende probar la hip6tesis nula 13i 0 contra la hip6tesis alternativa 13

i 0 ( i 12 k) La validez de este procedimiento se apoya

en las suposiciones establecidas previamente para cada combinaci6n de los valores de Xi existe una subpoblaci6n de valores de Y que siguen una distribuci6n nonnal con variancia a2bull

Prueba de hip6tesis para las f3t Para probar la hip6tesis nula de que es igual a algful valor en particular por ejemplo 130 es posible calcular la estadfstica de t

t (1043)

donde los grados de libertad son igual an - k - 1 Y es la desviaci6n estandar de las b

Las desviaciones estandar de las b estan dadas como parte de los resultados de la mayorfa de paquetes de software para computadora que hacen analisis de regresi6n

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 8: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

EJERCICIOS 481

FJERCICIOS

Obtenga la ecuaci6n de regresi6n para cada uno de los siguientes con juntos de datos

1031 Los individuos estudiados por Malec et al (A-2) fueron 16 graduados de un programa inteshygral de rehabilitaci6n de lesiones cerebrales postagudas Los investigadores examinaron las relaciones entre diversas variables que induian el resultado de trabajo (la escala iba de I para desempleado hasta 5 que representa empleo competitivo sin prestaciones) la calificaci6n al momento de la evaluaci6n inicial sobre el inventario de adaptabilidad Portland (PAl por sus siglas en Ingles) y el tiempo de permanencia en dfas Las mediciones registradas sobre estas tres variables son las siguientes

y XI

Resultado Tiempode x2 del permanencia PAl trabajo (dias) PRE

5 67 19 4 157 17 2 242 23 4 255 14 1 227 27 4 140 22 1 179 23 4 258 18 4 85 16 5 52 22 3 296 15 1 256 30 4 198 21 1 224 22 4 126 19 4 156 8

FUENn Utilizada con autorizaci6n deJames Malec PhD

1032 David y Riley (A-3) examinaron los factores cognoscitivos medidos con la prueba de nivel cognoscitivo de Allen (ACL por sus siglas en Ingles) y la relaci6n de la prueba con el nive de psicopatologfa Los individuos estudiados eran pacientes de la unidad de psiquiatrfa del Hospital GeneraL Entre las variables sobre las que trabajaron los investigadores ademas del ACL estaban las calificaciones sobre el vocabulario (V) y la abstracci6n (A) componenshytes del Instituto Shipley de la escala de vida y las calificaciones sobre la prueba de modalishydades de simbologia digital (PMSD) Se registraron las siguientes mediciones en 69 pacientes La variable dependiente es ACL

Individuo ACL PMSD V A

432 CAPITULO 10 REGRESI6N Y CORRELACI6N MULTIPLE

Individuo ACL PMSD V A

1 60 70 2 54 49 3 47 28 4 48 47 5 49 29 6 45 23 7 63 40 8 59 50 9 41 32

10 48 27 11 40 33 12 45 40 13 58 66 14 60 46 15 45 26 16 47 42

28 34 19 32 22 24 24 18 31 14 24 34 29 27 15 31

36 32 8

28 4

24 12 14 20

8 8

36 20 34 10 24

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

59 47 47 38 60 56 48 58 45 48 47 45 60 56 63 52

42 52 35 41 58 41 13 62 46 52 63 42 66 55 55 43

30 17 26 18 32 19 14 27 21 26 22 22 30 26 22 22

26 26 28 26 16 10 36 20 28 14 26 26 26 28 28

Individuo ACL PMSD V A

10 36 30 16 8 2

32 36 18 18 20 8

30 6 6 8 6 8

22 FUENTE Utilizada con autorizaci6n de Sandra K David OTRL

1033 En un estudio acerca de la percepcion de los posibles facto res relacionados con los patrones de admision en un gran hospital un administrador obtuvo estos datos a partir de 10 comushynidades dentro del area de captacion del hospital

16 32 26 11 18 14 30 30 31 23 28 17 31 12 18 23 22 13 30

Individuo ACL PMSD V A

52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

45 49 42 45 48 60 40 45 40 47 60 45 48 66 41 45 66 49

33 48 34 58 35 48 36 37 37 45 38 49 39 50 40 39 41 37 42 56 43 48 44 56 45 66 46 43 47 40 48 42 49 56 50 34 51 40

48 47 50 29 17 39 31 61 45 56 53 29 63 19 23 40 20

2 41

44 51 37 56 37 76 42 20 48 54 53 39 35 63 17 44 47 35

29 28 20 32 33 26 26 13 27 40 25 20 26 26 16 31 30 10

24 36 8

36 36 20 8

10 16 40 32

8 10 30 16 24 36 19

EJERCICIOS 483

Personas por cada 1000 Indice de disponibilidad internadas durante el de otros servicios de Indice de

periodo de estudio salud indigencia Comunidad (Y) (Xl) (X2)

1 616 60 63 2 532 44 55 3 655 91 36 4 649 81 58 5 727 97 68 6 522 48 79 7 502 76 42 8 440 44 60 9 538 91 28 10 535 67 67

Total 5716 699 556

1034 El administrador de un hospital general obtuvo los siguientes datos de 20 pacientes interveshynidos quirurgicamente durante un estudio para determinar que factores parecen estar relashycionados con eI tiempo de hospitalizacion

Tiempo de permanencia Numero de problemas Tiempo de permanencia posoperatoria en dias (Y) medicos actualmente (Xl) preoperatoria en dias (X2)

6 1 1 6 2 1

11 2 2 9 1 3

16 3 3 16 1 5 4 1 1 8 3 1

11 2 2 13 3 2 13 1 4 9 1 2

17 3 3 17 2 4 12 4 1 6 1 1 5 1 1

12 3 2 8 1 2 9 2 2

Total 208 38 43

484 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

1035 Una muestra aleatoria de 25 enfermeras seleccionadas de un directorio de enfermeras generales produjo la siguiente informaci6n respecto a la calificaci6n del examen de colocaci6n de cada una de elIas realizado por la direcci6n estatal de personal (en Estados Unidos) y la calificaci6n final de graduaci6n escolar Ambas calificaciones se relacionan con el area de afiliaci6n de las enfermeras Ademas se tuvo informaci6n de las calificaciones obtenidas por cada enfermera en una prueba de aptitud realizada al ingresar a la escuela de enfermeria Los datos completos son los siguientes

Calificaci6n de aprobaci6n Calificaci6n de la por el estado (Y) Calificaci6n final (Xl) prueba de aptitud (X

2)

440 87 92 480 87 79 535 87 99 460 88 91 525 88 84 480 89 71 510 89 78 530 89 78 545 89 71 600 89 76 495 90 89 545 90 90 575 90 73 525 91 71 575 91 81 600 91 84 490 92 70 510 92 85 575 92 71 540 93 76 595 93 90 525 94 94 545 94 94 600 94 93 625 94 73

Total 13425 2263 2053

1036 Se registraron los siguientes datos para una muestra aleatoria simple de 20 pacientes con hipertensi6n Las variables son

Y presi6n arterial sanguinea media (mm Hg)

XI edad (en afios)

X2 peso (kg)

X3 = area de la superficie corporal (m2)

X4

duraci6n de la hipertensi6n (afios)

X5 pulso basico (latidosmin)

X6 medici6n del estres

104 EVAIUACION DE LA ECUACION DE REGRESION MULTIPLE 485

Paciente Y Xl X2 X3 X4 X5 X6

1 105 47 854 175 51 63 33 2 115 49 942 210 38 70 14 3 116 49 953 198 82 72 10 4 117 50 947 201 58 73 99 5 112 51 894 189 70 72 95 6 121 48 995 225 93 71 10 7 121 49 998 225 25 69 42 8 110 47 909 190 62 66 8 9 110 49 892 183 71 69 62

10 114 48 927 207 56 64 35 11 114 47 944 207 53 74 90 12 115 49 941 198 56 71 21 13 114 50 916 205 102 68 47 14 106 45 871 192 56 67 80 15 125 52 1013 219 100 76 98 16 114 46 945 198 74 69 95 17 106 46 870 187 36 62 18 18 113 46 945 190 43 70 12 19 110 48 905 188 90 71 99 20 122 56 957 209 70 75 99

104 EVALUACION DE L ECUACION DE REGRESION MULTIPLE

Antes de utilizar una ecuaci6n de regresi6n multiple para predicci6n y estimaci6n es conveniente determinar primero si de hecho vale la pena utilizarla AI estudiar la regresi6n lineal simple se aprendi6 que puede evaluarse la utili dad de una ecuaci6n de regresi6n considerando el coeficiente de determinaci6n de la muestra y la penshydiente estimada AI evaluar la ecuaci6n de regresi6n multiple la atenci6n se centra en el coeficiente de determinaci6n multiple y los coeficientes de regresi6n parciales

El coeficiente de determinacion mUltiple En el capitulo 9 se estudia con detalle el coeficiente de determinaci6n El concepto se extiende 16gicamente al caso de la regresi6n multiple La variacion total presente en los valores de Y puede dividirshyse en dos componentes la variaci6n explicada que mide la cantidad de la variaci6n total que es explicada por la superficie de regresi6n ajustada y la variaci6n inexplicashyda que es aquella parte de la variaci6n total que no es explicada por el ajuste de la superficie de regresion La medida de la variaci6n en cada caso es una suma de desshyviaciones elevadas al cuadrado La variaci6n total es la surna de desviaciones al cuashydrado de cada observaci6n de Ya partir de la media de las observaciones y se designa por 2(Yj - y)2 0 SC

tata] La variaci6n explicada designada por 2(yj )1)2 es la surna

de las desviaciones al cuadrado de los valores calculados a partir de la media de los val ores de Y observados Esta suma de desviaciones al cuadrado es la suma de cuadrashy

486 CAPITULO 10 REGRESIONY CORRELACION MULTIPLE

dos debida a la regresi6n (SCR) La variacion inexplicada escrita como 2(Yj y)2es la

suma de las desviaciones al cuadrado de las observaciones originales a partir de los valores calculados A esta cantidad se Ie conoce tambien como la suma de cuadrados en torno a la regresiOn 0 la suma del cuadrado de los errores (SCE) Se puede resumir la relashycion entre las tres sumas de cuadrados con la siguiente ecuacion

L(Yj W L(Yj - W + L(Yj - Yj)2 (1041)

SCwtal = SCR + SCE

suma total de cuadrados = suma de cuadrados explicados (debido a la regresion) + suma de cuadrados no explicados (de los errores)

El coeficiente de determinacion multiple R12 k se obtiene al dividir la suma de cuadrados explicados entre la suma total de cuadrados Esto es

R2 = L(Yj - y)2 (1042)y12 L(Yj _ y)2

El subindice y12 k nos seiiala que en el analisis Yes tratada como variable dependiente y que las variables desde Xl hasta X

k son tratadas como variables indeshy

pendientes EI valor de R12k indica que proporcion del total de variacion en los valores de Y observados es explicada por la regresion de Y sobre XI X

2 bull bull X En

otras palabras se dice que R12 k es una medida de bondad de ajuste de la superfishycie de regresion Esta cantidad es analoga a r2 calculada en el capitulo 9

FJEMPLO 1041

Con suite el ejercicio 1031 Ycalcule R12

Solndon Para el ejemplo se tiene en la figura 1031 que

SC = 1489671total

SCR = 118060 SCE 30911

R212 = 118060 = 7925 7930 y 148971

Se puede decir que aproximadamente 793 por ciento del total de la variacion en los valores de Y se explica a traves del plano de regresion ajustado es decir a traves de la relacion lineal con Xl y X2bull bull

Prueba de hip6tesis de ta regresi6n Para determinar si la regresion comshypleta es significativa (es decir para determinar si R212 es trascendente) se puede aplicar la prueba de hipotesis como sigue Y

1 Datos La situacion de la investigacion y los datos generados por el investishygador se examinan para determinar si la regresion multiple es una tecnica

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 487

TABlA 1041 Tabla NOVA para la regresion multiple

Fuente SC gl CM Rv

Debido a la regresi6n Respecto a la regresi6n

SCR SCE

k n-k-l

CMR SCRk CME = SCE(n-k-l)

CMRCME

Total SCtotal

n 1

2 Supuestos Se considera que el modelo de regresi6n multiple y las suposishyciones basicas tal como se presentan en la secci6n 102 son ap1icables

3 Hipotesis En general la hip6tesis nula es Ho P = P == P = Ph 0 y l 2 3 la hip6tesis alternativa es H

A no todas las Pi = O En palabras la hip6tesis nula

afrrma que todas las variables independientes carecen de valor para explicar la variaci6n enlos valores de Y

4 Estadistica de prueba La estadfstica de prueba conveniente es RY que se calcula como parte del analisis de la variancia La tabla AN OVA se muestra en la tabla 10041 En la tabla 10041 CMR simboliza el cuadrado medio debido a la regresi6n y CME simboliza el cuadrado medio respecto a la regresi6n 0

como algunas veces se Ie llama el cuadrado medio del error

5 Distribuci6n de la estadistica de prueba Cuando Ho es verdadera y se cumshyplen las suposiciones RY sigue una distribuci6n F con k y n - k - 1 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de RY es mayor 0

igual que el valor cdtico de F

7 Ca1cular la estadfstica de prueba Vease la tabla 1004 I

8 Decision estadistica Se rechaza 0 no se rechaza Ho de acuerdo con la regIa de decisi6n

9 Conclusion Si se rechaza Ho se concluye que en la poblacion de la que se extr~io la muestra la variable dependiente esta relacionada en forma lineal con las variables independientes como un solo grupo Si no se rechazaHose conshycluye que en la poblacion no existe relacion lineal entre la variable depenshydiente y las variables independientes como un solo grupo

10 El valor de p Se obtiene e1 valorp a partir de la tabla para la distribuci6n F

Con el siguiente ejemplo se muestra el procedimiento de la prueba de hipotesis

F~EMPLO 1042

Se pretende probar la hipotesis nula de que no hay relacion lineal entre las tres variables analizadas en e1 ejemplo 1031 1-450IA2 el numero de cigarros fumados por dfa y el nive1 de cotinina urinaria

Solucion

1 Datos Vease la descripcion de los datos dados en el ejemplo 1031

488 CAPITULO 10 REGRESION Y CORRELACION ~nJLTIPLE

2 Supuestos Se supone que las consideraciones analizadas en la secci6n 102 se cumplen

3 Hipotesis

Ho 13 = 132 0

H A no todas las 13i = 0

4 Estadistica de prueba La estadistica de prueba es Rv 5 Distribucion de Ia prueba estadistica Si Ho es verdadera y las

suposiciones se cumplen la estadistica de prueba sigue una distrishybuci6n F con 2 como numerador y 16 como denominador para los grados de libertad

6 RegIa de decision Se utiliza un nivel trascendente de a OL Por 10 tanto la regIa de decisi6n rechaza Ho si el valor calculado de RV es mayor 0 igual que 623

7 Calculo de la estadistica de prueba En la FIgura 1031 se muesshytra la tabla ANOVA para este ejemplo en la cual se puede ver que RV es igual a 3056

8 Decision estadistica Puesto que 3056 es mayor que 623 se reshychaza Ho

9 Conclusion Se concluye que en la poblaci6n de la cual se extrashyjo la muestra existe relaci6n lineal entre las tres variables

10 Valor de p Puesto que 3056 es mayor que 751 el valor de p para la prueba es menor que 005 bull

Inferencias con respecto a las f3 individuales Por 10 general se pretenshyde evaluar la fuerza de la relaci6n lineal entre Y y las variables independientes de manera individual Es decir se pretende probar la hip6tesis nula 13i 0 contra la hip6tesis alternativa 13

i 0 ( i 12 k) La validez de este procedimiento se apoya

en las suposiciones establecidas previamente para cada combinaci6n de los valores de Xi existe una subpoblaci6n de valores de Y que siguen una distribuci6n nonnal con variancia a2bull

Prueba de hip6tesis para las f3t Para probar la hip6tesis nula de que es igual a algful valor en particular por ejemplo 130 es posible calcular la estadfstica de t

t (1043)

donde los grados de libertad son igual an - k - 1 Y es la desviaci6n estandar de las b

Las desviaciones estandar de las b estan dadas como parte de los resultados de la mayorfa de paquetes de software para computadora que hacen analisis de regresi6n

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 9: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

Individuo ACL PMSD V A

432 CAPITULO 10 REGRESI6N Y CORRELACI6N MULTIPLE

Individuo ACL PMSD V A

1 60 70 2 54 49 3 47 28 4 48 47 5 49 29 6 45 23 7 63 40 8 59 50 9 41 32

10 48 27 11 40 33 12 45 40 13 58 66 14 60 46 15 45 26 16 47 42

28 34 19 32 22 24 24 18 31 14 24 34 29 27 15 31

36 32 8

28 4

24 12 14 20

8 8

36 20 34 10 24

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

59 47 47 38 60 56 48 58 45 48 47 45 60 56 63 52

42 52 35 41 58 41 13 62 46 52 63 42 66 55 55 43

30 17 26 18 32 19 14 27 21 26 22 22 30 26 22 22

26 26 28 26 16 10 36 20 28 14 26 26 26 28 28

Individuo ACL PMSD V A

10 36 30 16 8 2

32 36 18 18 20 8

30 6 6 8 6 8

22 FUENTE Utilizada con autorizaci6n de Sandra K David OTRL

1033 En un estudio acerca de la percepcion de los posibles facto res relacionados con los patrones de admision en un gran hospital un administrador obtuvo estos datos a partir de 10 comushynidades dentro del area de captacion del hospital

16 32 26 11 18 14 30 30 31 23 28 17 31 12 18 23 22 13 30

Individuo ACL PMSD V A

52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

45 49 42 45 48 60 40 45 40 47 60 45 48 66 41 45 66 49

33 48 34 58 35 48 36 37 37 45 38 49 39 50 40 39 41 37 42 56 43 48 44 56 45 66 46 43 47 40 48 42 49 56 50 34 51 40

48 47 50 29 17 39 31 61 45 56 53 29 63 19 23 40 20

2 41

44 51 37 56 37 76 42 20 48 54 53 39 35 63 17 44 47 35

29 28 20 32 33 26 26 13 27 40 25 20 26 26 16 31 30 10

24 36 8

36 36 20 8

10 16 40 32

8 10 30 16 24 36 19

EJERCICIOS 483

Personas por cada 1000 Indice de disponibilidad internadas durante el de otros servicios de Indice de

periodo de estudio salud indigencia Comunidad (Y) (Xl) (X2)

1 616 60 63 2 532 44 55 3 655 91 36 4 649 81 58 5 727 97 68 6 522 48 79 7 502 76 42 8 440 44 60 9 538 91 28 10 535 67 67

Total 5716 699 556

1034 El administrador de un hospital general obtuvo los siguientes datos de 20 pacientes interveshynidos quirurgicamente durante un estudio para determinar que factores parecen estar relashycionados con eI tiempo de hospitalizacion

Tiempo de permanencia Numero de problemas Tiempo de permanencia posoperatoria en dias (Y) medicos actualmente (Xl) preoperatoria en dias (X2)

6 1 1 6 2 1

11 2 2 9 1 3

16 3 3 16 1 5 4 1 1 8 3 1

11 2 2 13 3 2 13 1 4 9 1 2

17 3 3 17 2 4 12 4 1 6 1 1 5 1 1

12 3 2 8 1 2 9 2 2

Total 208 38 43

484 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

1035 Una muestra aleatoria de 25 enfermeras seleccionadas de un directorio de enfermeras generales produjo la siguiente informaci6n respecto a la calificaci6n del examen de colocaci6n de cada una de elIas realizado por la direcci6n estatal de personal (en Estados Unidos) y la calificaci6n final de graduaci6n escolar Ambas calificaciones se relacionan con el area de afiliaci6n de las enfermeras Ademas se tuvo informaci6n de las calificaciones obtenidas por cada enfermera en una prueba de aptitud realizada al ingresar a la escuela de enfermeria Los datos completos son los siguientes

Calificaci6n de aprobaci6n Calificaci6n de la por el estado (Y) Calificaci6n final (Xl) prueba de aptitud (X

2)

440 87 92 480 87 79 535 87 99 460 88 91 525 88 84 480 89 71 510 89 78 530 89 78 545 89 71 600 89 76 495 90 89 545 90 90 575 90 73 525 91 71 575 91 81 600 91 84 490 92 70 510 92 85 575 92 71 540 93 76 595 93 90 525 94 94 545 94 94 600 94 93 625 94 73

Total 13425 2263 2053

1036 Se registraron los siguientes datos para una muestra aleatoria simple de 20 pacientes con hipertensi6n Las variables son

Y presi6n arterial sanguinea media (mm Hg)

XI edad (en afios)

X2 peso (kg)

X3 = area de la superficie corporal (m2)

X4

duraci6n de la hipertensi6n (afios)

X5 pulso basico (latidosmin)

X6 medici6n del estres

104 EVAIUACION DE LA ECUACION DE REGRESION MULTIPLE 485

Paciente Y Xl X2 X3 X4 X5 X6

1 105 47 854 175 51 63 33 2 115 49 942 210 38 70 14 3 116 49 953 198 82 72 10 4 117 50 947 201 58 73 99 5 112 51 894 189 70 72 95 6 121 48 995 225 93 71 10 7 121 49 998 225 25 69 42 8 110 47 909 190 62 66 8 9 110 49 892 183 71 69 62

10 114 48 927 207 56 64 35 11 114 47 944 207 53 74 90 12 115 49 941 198 56 71 21 13 114 50 916 205 102 68 47 14 106 45 871 192 56 67 80 15 125 52 1013 219 100 76 98 16 114 46 945 198 74 69 95 17 106 46 870 187 36 62 18 18 113 46 945 190 43 70 12 19 110 48 905 188 90 71 99 20 122 56 957 209 70 75 99

104 EVALUACION DE L ECUACION DE REGRESION MULTIPLE

Antes de utilizar una ecuaci6n de regresi6n multiple para predicci6n y estimaci6n es conveniente determinar primero si de hecho vale la pena utilizarla AI estudiar la regresi6n lineal simple se aprendi6 que puede evaluarse la utili dad de una ecuaci6n de regresi6n considerando el coeficiente de determinaci6n de la muestra y la penshydiente estimada AI evaluar la ecuaci6n de regresi6n multiple la atenci6n se centra en el coeficiente de determinaci6n multiple y los coeficientes de regresi6n parciales

El coeficiente de determinacion mUltiple En el capitulo 9 se estudia con detalle el coeficiente de determinaci6n El concepto se extiende 16gicamente al caso de la regresi6n multiple La variacion total presente en los valores de Y puede dividirshyse en dos componentes la variaci6n explicada que mide la cantidad de la variaci6n total que es explicada por la superficie de regresi6n ajustada y la variaci6n inexplicashyda que es aquella parte de la variaci6n total que no es explicada por el ajuste de la superficie de regresion La medida de la variaci6n en cada caso es una suma de desshyviaciones elevadas al cuadrado La variaci6n total es la surna de desviaciones al cuashydrado de cada observaci6n de Ya partir de la media de las observaciones y se designa por 2(Yj - y)2 0 SC

tata] La variaci6n explicada designada por 2(yj )1)2 es la surna

de las desviaciones al cuadrado de los valores calculados a partir de la media de los val ores de Y observados Esta suma de desviaciones al cuadrado es la suma de cuadrashy

486 CAPITULO 10 REGRESIONY CORRELACION MULTIPLE

dos debida a la regresi6n (SCR) La variacion inexplicada escrita como 2(Yj y)2es la

suma de las desviaciones al cuadrado de las observaciones originales a partir de los valores calculados A esta cantidad se Ie conoce tambien como la suma de cuadrados en torno a la regresiOn 0 la suma del cuadrado de los errores (SCE) Se puede resumir la relashycion entre las tres sumas de cuadrados con la siguiente ecuacion

L(Yj W L(Yj - W + L(Yj - Yj)2 (1041)

SCwtal = SCR + SCE

suma total de cuadrados = suma de cuadrados explicados (debido a la regresion) + suma de cuadrados no explicados (de los errores)

El coeficiente de determinacion multiple R12 k se obtiene al dividir la suma de cuadrados explicados entre la suma total de cuadrados Esto es

R2 = L(Yj - y)2 (1042)y12 L(Yj _ y)2

El subindice y12 k nos seiiala que en el analisis Yes tratada como variable dependiente y que las variables desde Xl hasta X

k son tratadas como variables indeshy

pendientes EI valor de R12k indica que proporcion del total de variacion en los valores de Y observados es explicada por la regresion de Y sobre XI X

2 bull bull X En

otras palabras se dice que R12 k es una medida de bondad de ajuste de la superfishycie de regresion Esta cantidad es analoga a r2 calculada en el capitulo 9

FJEMPLO 1041

Con suite el ejercicio 1031 Ycalcule R12

Solndon Para el ejemplo se tiene en la figura 1031 que

SC = 1489671total

SCR = 118060 SCE 30911

R212 = 118060 = 7925 7930 y 148971

Se puede decir que aproximadamente 793 por ciento del total de la variacion en los valores de Y se explica a traves del plano de regresion ajustado es decir a traves de la relacion lineal con Xl y X2bull bull

Prueba de hip6tesis de ta regresi6n Para determinar si la regresion comshypleta es significativa (es decir para determinar si R212 es trascendente) se puede aplicar la prueba de hipotesis como sigue Y

1 Datos La situacion de la investigacion y los datos generados por el investishygador se examinan para determinar si la regresion multiple es una tecnica

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 487

TABlA 1041 Tabla NOVA para la regresion multiple

Fuente SC gl CM Rv

Debido a la regresi6n Respecto a la regresi6n

SCR SCE

k n-k-l

CMR SCRk CME = SCE(n-k-l)

CMRCME

Total SCtotal

n 1

2 Supuestos Se considera que el modelo de regresi6n multiple y las suposishyciones basicas tal como se presentan en la secci6n 102 son ap1icables

3 Hipotesis En general la hip6tesis nula es Ho P = P == P = Ph 0 y l 2 3 la hip6tesis alternativa es H

A no todas las Pi = O En palabras la hip6tesis nula

afrrma que todas las variables independientes carecen de valor para explicar la variaci6n enlos valores de Y

4 Estadistica de prueba La estadfstica de prueba conveniente es RY que se calcula como parte del analisis de la variancia La tabla AN OVA se muestra en la tabla 10041 En la tabla 10041 CMR simboliza el cuadrado medio debido a la regresi6n y CME simboliza el cuadrado medio respecto a la regresi6n 0

como algunas veces se Ie llama el cuadrado medio del error

5 Distribuci6n de la estadistica de prueba Cuando Ho es verdadera y se cumshyplen las suposiciones RY sigue una distribuci6n F con k y n - k - 1 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de RY es mayor 0

igual que el valor cdtico de F

7 Ca1cular la estadfstica de prueba Vease la tabla 1004 I

8 Decision estadistica Se rechaza 0 no se rechaza Ho de acuerdo con la regIa de decisi6n

9 Conclusion Si se rechaza Ho se concluye que en la poblacion de la que se extr~io la muestra la variable dependiente esta relacionada en forma lineal con las variables independientes como un solo grupo Si no se rechazaHose conshycluye que en la poblacion no existe relacion lineal entre la variable depenshydiente y las variables independientes como un solo grupo

10 El valor de p Se obtiene e1 valorp a partir de la tabla para la distribuci6n F

Con el siguiente ejemplo se muestra el procedimiento de la prueba de hipotesis

F~EMPLO 1042

Se pretende probar la hipotesis nula de que no hay relacion lineal entre las tres variables analizadas en e1 ejemplo 1031 1-450IA2 el numero de cigarros fumados por dfa y el nive1 de cotinina urinaria

Solucion

1 Datos Vease la descripcion de los datos dados en el ejemplo 1031

488 CAPITULO 10 REGRESION Y CORRELACION ~nJLTIPLE

2 Supuestos Se supone que las consideraciones analizadas en la secci6n 102 se cumplen

3 Hipotesis

Ho 13 = 132 0

H A no todas las 13i = 0

4 Estadistica de prueba La estadistica de prueba es Rv 5 Distribucion de Ia prueba estadistica Si Ho es verdadera y las

suposiciones se cumplen la estadistica de prueba sigue una distrishybuci6n F con 2 como numerador y 16 como denominador para los grados de libertad

6 RegIa de decision Se utiliza un nivel trascendente de a OL Por 10 tanto la regIa de decisi6n rechaza Ho si el valor calculado de RV es mayor 0 igual que 623

7 Calculo de la estadistica de prueba En la FIgura 1031 se muesshytra la tabla ANOVA para este ejemplo en la cual se puede ver que RV es igual a 3056

8 Decision estadistica Puesto que 3056 es mayor que 623 se reshychaza Ho

9 Conclusion Se concluye que en la poblaci6n de la cual se extrashyjo la muestra existe relaci6n lineal entre las tres variables

10 Valor de p Puesto que 3056 es mayor que 751 el valor de p para la prueba es menor que 005 bull

Inferencias con respecto a las f3 individuales Por 10 general se pretenshyde evaluar la fuerza de la relaci6n lineal entre Y y las variables independientes de manera individual Es decir se pretende probar la hip6tesis nula 13i 0 contra la hip6tesis alternativa 13

i 0 ( i 12 k) La validez de este procedimiento se apoya

en las suposiciones establecidas previamente para cada combinaci6n de los valores de Xi existe una subpoblaci6n de valores de Y que siguen una distribuci6n nonnal con variancia a2bull

Prueba de hip6tesis para las f3t Para probar la hip6tesis nula de que es igual a algful valor en particular por ejemplo 130 es posible calcular la estadfstica de t

t (1043)

donde los grados de libertad son igual an - k - 1 Y es la desviaci6n estandar de las b

Las desviaciones estandar de las b estan dadas como parte de los resultados de la mayorfa de paquetes de software para computadora que hacen analisis de regresi6n

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 10: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

EJERCICIOS 483

Personas por cada 1000 Indice de disponibilidad internadas durante el de otros servicios de Indice de

periodo de estudio salud indigencia Comunidad (Y) (Xl) (X2)

1 616 60 63 2 532 44 55 3 655 91 36 4 649 81 58 5 727 97 68 6 522 48 79 7 502 76 42 8 440 44 60 9 538 91 28 10 535 67 67

Total 5716 699 556

1034 El administrador de un hospital general obtuvo los siguientes datos de 20 pacientes interveshynidos quirurgicamente durante un estudio para determinar que factores parecen estar relashycionados con eI tiempo de hospitalizacion

Tiempo de permanencia Numero de problemas Tiempo de permanencia posoperatoria en dias (Y) medicos actualmente (Xl) preoperatoria en dias (X2)

6 1 1 6 2 1

11 2 2 9 1 3

16 3 3 16 1 5 4 1 1 8 3 1

11 2 2 13 3 2 13 1 4 9 1 2

17 3 3 17 2 4 12 4 1 6 1 1 5 1 1

12 3 2 8 1 2 9 2 2

Total 208 38 43

484 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

1035 Una muestra aleatoria de 25 enfermeras seleccionadas de un directorio de enfermeras generales produjo la siguiente informaci6n respecto a la calificaci6n del examen de colocaci6n de cada una de elIas realizado por la direcci6n estatal de personal (en Estados Unidos) y la calificaci6n final de graduaci6n escolar Ambas calificaciones se relacionan con el area de afiliaci6n de las enfermeras Ademas se tuvo informaci6n de las calificaciones obtenidas por cada enfermera en una prueba de aptitud realizada al ingresar a la escuela de enfermeria Los datos completos son los siguientes

Calificaci6n de aprobaci6n Calificaci6n de la por el estado (Y) Calificaci6n final (Xl) prueba de aptitud (X

2)

440 87 92 480 87 79 535 87 99 460 88 91 525 88 84 480 89 71 510 89 78 530 89 78 545 89 71 600 89 76 495 90 89 545 90 90 575 90 73 525 91 71 575 91 81 600 91 84 490 92 70 510 92 85 575 92 71 540 93 76 595 93 90 525 94 94 545 94 94 600 94 93 625 94 73

Total 13425 2263 2053

1036 Se registraron los siguientes datos para una muestra aleatoria simple de 20 pacientes con hipertensi6n Las variables son

Y presi6n arterial sanguinea media (mm Hg)

XI edad (en afios)

X2 peso (kg)

X3 = area de la superficie corporal (m2)

X4

duraci6n de la hipertensi6n (afios)

X5 pulso basico (latidosmin)

X6 medici6n del estres

104 EVAIUACION DE LA ECUACION DE REGRESION MULTIPLE 485

Paciente Y Xl X2 X3 X4 X5 X6

1 105 47 854 175 51 63 33 2 115 49 942 210 38 70 14 3 116 49 953 198 82 72 10 4 117 50 947 201 58 73 99 5 112 51 894 189 70 72 95 6 121 48 995 225 93 71 10 7 121 49 998 225 25 69 42 8 110 47 909 190 62 66 8 9 110 49 892 183 71 69 62

10 114 48 927 207 56 64 35 11 114 47 944 207 53 74 90 12 115 49 941 198 56 71 21 13 114 50 916 205 102 68 47 14 106 45 871 192 56 67 80 15 125 52 1013 219 100 76 98 16 114 46 945 198 74 69 95 17 106 46 870 187 36 62 18 18 113 46 945 190 43 70 12 19 110 48 905 188 90 71 99 20 122 56 957 209 70 75 99

104 EVALUACION DE L ECUACION DE REGRESION MULTIPLE

Antes de utilizar una ecuaci6n de regresi6n multiple para predicci6n y estimaci6n es conveniente determinar primero si de hecho vale la pena utilizarla AI estudiar la regresi6n lineal simple se aprendi6 que puede evaluarse la utili dad de una ecuaci6n de regresi6n considerando el coeficiente de determinaci6n de la muestra y la penshydiente estimada AI evaluar la ecuaci6n de regresi6n multiple la atenci6n se centra en el coeficiente de determinaci6n multiple y los coeficientes de regresi6n parciales

El coeficiente de determinacion mUltiple En el capitulo 9 se estudia con detalle el coeficiente de determinaci6n El concepto se extiende 16gicamente al caso de la regresi6n multiple La variacion total presente en los valores de Y puede dividirshyse en dos componentes la variaci6n explicada que mide la cantidad de la variaci6n total que es explicada por la superficie de regresi6n ajustada y la variaci6n inexplicashyda que es aquella parte de la variaci6n total que no es explicada por el ajuste de la superficie de regresion La medida de la variaci6n en cada caso es una suma de desshyviaciones elevadas al cuadrado La variaci6n total es la surna de desviaciones al cuashydrado de cada observaci6n de Ya partir de la media de las observaciones y se designa por 2(Yj - y)2 0 SC

tata] La variaci6n explicada designada por 2(yj )1)2 es la surna

de las desviaciones al cuadrado de los valores calculados a partir de la media de los val ores de Y observados Esta suma de desviaciones al cuadrado es la suma de cuadrashy

486 CAPITULO 10 REGRESIONY CORRELACION MULTIPLE

dos debida a la regresi6n (SCR) La variacion inexplicada escrita como 2(Yj y)2es la

suma de las desviaciones al cuadrado de las observaciones originales a partir de los valores calculados A esta cantidad se Ie conoce tambien como la suma de cuadrados en torno a la regresiOn 0 la suma del cuadrado de los errores (SCE) Se puede resumir la relashycion entre las tres sumas de cuadrados con la siguiente ecuacion

L(Yj W L(Yj - W + L(Yj - Yj)2 (1041)

SCwtal = SCR + SCE

suma total de cuadrados = suma de cuadrados explicados (debido a la regresion) + suma de cuadrados no explicados (de los errores)

El coeficiente de determinacion multiple R12 k se obtiene al dividir la suma de cuadrados explicados entre la suma total de cuadrados Esto es

R2 = L(Yj - y)2 (1042)y12 L(Yj _ y)2

El subindice y12 k nos seiiala que en el analisis Yes tratada como variable dependiente y que las variables desde Xl hasta X

k son tratadas como variables indeshy

pendientes EI valor de R12k indica que proporcion del total de variacion en los valores de Y observados es explicada por la regresion de Y sobre XI X

2 bull bull X En

otras palabras se dice que R12 k es una medida de bondad de ajuste de la superfishycie de regresion Esta cantidad es analoga a r2 calculada en el capitulo 9

FJEMPLO 1041

Con suite el ejercicio 1031 Ycalcule R12

Solndon Para el ejemplo se tiene en la figura 1031 que

SC = 1489671total

SCR = 118060 SCE 30911

R212 = 118060 = 7925 7930 y 148971

Se puede decir que aproximadamente 793 por ciento del total de la variacion en los valores de Y se explica a traves del plano de regresion ajustado es decir a traves de la relacion lineal con Xl y X2bull bull

Prueba de hip6tesis de ta regresi6n Para determinar si la regresion comshypleta es significativa (es decir para determinar si R212 es trascendente) se puede aplicar la prueba de hipotesis como sigue Y

1 Datos La situacion de la investigacion y los datos generados por el investishygador se examinan para determinar si la regresion multiple es una tecnica

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 487

TABlA 1041 Tabla NOVA para la regresion multiple

Fuente SC gl CM Rv

Debido a la regresi6n Respecto a la regresi6n

SCR SCE

k n-k-l

CMR SCRk CME = SCE(n-k-l)

CMRCME

Total SCtotal

n 1

2 Supuestos Se considera que el modelo de regresi6n multiple y las suposishyciones basicas tal como se presentan en la secci6n 102 son ap1icables

3 Hipotesis En general la hip6tesis nula es Ho P = P == P = Ph 0 y l 2 3 la hip6tesis alternativa es H

A no todas las Pi = O En palabras la hip6tesis nula

afrrma que todas las variables independientes carecen de valor para explicar la variaci6n enlos valores de Y

4 Estadistica de prueba La estadfstica de prueba conveniente es RY que se calcula como parte del analisis de la variancia La tabla AN OVA se muestra en la tabla 10041 En la tabla 10041 CMR simboliza el cuadrado medio debido a la regresi6n y CME simboliza el cuadrado medio respecto a la regresi6n 0

como algunas veces se Ie llama el cuadrado medio del error

5 Distribuci6n de la estadistica de prueba Cuando Ho es verdadera y se cumshyplen las suposiciones RY sigue una distribuci6n F con k y n - k - 1 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de RY es mayor 0

igual que el valor cdtico de F

7 Ca1cular la estadfstica de prueba Vease la tabla 1004 I

8 Decision estadistica Se rechaza 0 no se rechaza Ho de acuerdo con la regIa de decisi6n

9 Conclusion Si se rechaza Ho se concluye que en la poblacion de la que se extr~io la muestra la variable dependiente esta relacionada en forma lineal con las variables independientes como un solo grupo Si no se rechazaHose conshycluye que en la poblacion no existe relacion lineal entre la variable depenshydiente y las variables independientes como un solo grupo

10 El valor de p Se obtiene e1 valorp a partir de la tabla para la distribuci6n F

Con el siguiente ejemplo se muestra el procedimiento de la prueba de hipotesis

F~EMPLO 1042

Se pretende probar la hipotesis nula de que no hay relacion lineal entre las tres variables analizadas en e1 ejemplo 1031 1-450IA2 el numero de cigarros fumados por dfa y el nive1 de cotinina urinaria

Solucion

1 Datos Vease la descripcion de los datos dados en el ejemplo 1031

488 CAPITULO 10 REGRESION Y CORRELACION ~nJLTIPLE

2 Supuestos Se supone que las consideraciones analizadas en la secci6n 102 se cumplen

3 Hipotesis

Ho 13 = 132 0

H A no todas las 13i = 0

4 Estadistica de prueba La estadistica de prueba es Rv 5 Distribucion de Ia prueba estadistica Si Ho es verdadera y las

suposiciones se cumplen la estadistica de prueba sigue una distrishybuci6n F con 2 como numerador y 16 como denominador para los grados de libertad

6 RegIa de decision Se utiliza un nivel trascendente de a OL Por 10 tanto la regIa de decisi6n rechaza Ho si el valor calculado de RV es mayor 0 igual que 623

7 Calculo de la estadistica de prueba En la FIgura 1031 se muesshytra la tabla ANOVA para este ejemplo en la cual se puede ver que RV es igual a 3056

8 Decision estadistica Puesto que 3056 es mayor que 623 se reshychaza Ho

9 Conclusion Se concluye que en la poblaci6n de la cual se extrashyjo la muestra existe relaci6n lineal entre las tres variables

10 Valor de p Puesto que 3056 es mayor que 751 el valor de p para la prueba es menor que 005 bull

Inferencias con respecto a las f3 individuales Por 10 general se pretenshyde evaluar la fuerza de la relaci6n lineal entre Y y las variables independientes de manera individual Es decir se pretende probar la hip6tesis nula 13i 0 contra la hip6tesis alternativa 13

i 0 ( i 12 k) La validez de este procedimiento se apoya

en las suposiciones establecidas previamente para cada combinaci6n de los valores de Xi existe una subpoblaci6n de valores de Y que siguen una distribuci6n nonnal con variancia a2bull

Prueba de hip6tesis para las f3t Para probar la hip6tesis nula de que es igual a algful valor en particular por ejemplo 130 es posible calcular la estadfstica de t

t (1043)

donde los grados de libertad son igual an - k - 1 Y es la desviaci6n estandar de las b

Las desviaciones estandar de las b estan dadas como parte de los resultados de la mayorfa de paquetes de software para computadora que hacen analisis de regresi6n

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 11: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

484 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

1035 Una muestra aleatoria de 25 enfermeras seleccionadas de un directorio de enfermeras generales produjo la siguiente informaci6n respecto a la calificaci6n del examen de colocaci6n de cada una de elIas realizado por la direcci6n estatal de personal (en Estados Unidos) y la calificaci6n final de graduaci6n escolar Ambas calificaciones se relacionan con el area de afiliaci6n de las enfermeras Ademas se tuvo informaci6n de las calificaciones obtenidas por cada enfermera en una prueba de aptitud realizada al ingresar a la escuela de enfermeria Los datos completos son los siguientes

Calificaci6n de aprobaci6n Calificaci6n de la por el estado (Y) Calificaci6n final (Xl) prueba de aptitud (X

2)

440 87 92 480 87 79 535 87 99 460 88 91 525 88 84 480 89 71 510 89 78 530 89 78 545 89 71 600 89 76 495 90 89 545 90 90 575 90 73 525 91 71 575 91 81 600 91 84 490 92 70 510 92 85 575 92 71 540 93 76 595 93 90 525 94 94 545 94 94 600 94 93 625 94 73

Total 13425 2263 2053

1036 Se registraron los siguientes datos para una muestra aleatoria simple de 20 pacientes con hipertensi6n Las variables son

Y presi6n arterial sanguinea media (mm Hg)

XI edad (en afios)

X2 peso (kg)

X3 = area de la superficie corporal (m2)

X4

duraci6n de la hipertensi6n (afios)

X5 pulso basico (latidosmin)

X6 medici6n del estres

104 EVAIUACION DE LA ECUACION DE REGRESION MULTIPLE 485

Paciente Y Xl X2 X3 X4 X5 X6

1 105 47 854 175 51 63 33 2 115 49 942 210 38 70 14 3 116 49 953 198 82 72 10 4 117 50 947 201 58 73 99 5 112 51 894 189 70 72 95 6 121 48 995 225 93 71 10 7 121 49 998 225 25 69 42 8 110 47 909 190 62 66 8 9 110 49 892 183 71 69 62

10 114 48 927 207 56 64 35 11 114 47 944 207 53 74 90 12 115 49 941 198 56 71 21 13 114 50 916 205 102 68 47 14 106 45 871 192 56 67 80 15 125 52 1013 219 100 76 98 16 114 46 945 198 74 69 95 17 106 46 870 187 36 62 18 18 113 46 945 190 43 70 12 19 110 48 905 188 90 71 99 20 122 56 957 209 70 75 99

104 EVALUACION DE L ECUACION DE REGRESION MULTIPLE

Antes de utilizar una ecuaci6n de regresi6n multiple para predicci6n y estimaci6n es conveniente determinar primero si de hecho vale la pena utilizarla AI estudiar la regresi6n lineal simple se aprendi6 que puede evaluarse la utili dad de una ecuaci6n de regresi6n considerando el coeficiente de determinaci6n de la muestra y la penshydiente estimada AI evaluar la ecuaci6n de regresi6n multiple la atenci6n se centra en el coeficiente de determinaci6n multiple y los coeficientes de regresi6n parciales

El coeficiente de determinacion mUltiple En el capitulo 9 se estudia con detalle el coeficiente de determinaci6n El concepto se extiende 16gicamente al caso de la regresi6n multiple La variacion total presente en los valores de Y puede dividirshyse en dos componentes la variaci6n explicada que mide la cantidad de la variaci6n total que es explicada por la superficie de regresi6n ajustada y la variaci6n inexplicashyda que es aquella parte de la variaci6n total que no es explicada por el ajuste de la superficie de regresion La medida de la variaci6n en cada caso es una suma de desshyviaciones elevadas al cuadrado La variaci6n total es la surna de desviaciones al cuashydrado de cada observaci6n de Ya partir de la media de las observaciones y se designa por 2(Yj - y)2 0 SC

tata] La variaci6n explicada designada por 2(yj )1)2 es la surna

de las desviaciones al cuadrado de los valores calculados a partir de la media de los val ores de Y observados Esta suma de desviaciones al cuadrado es la suma de cuadrashy

486 CAPITULO 10 REGRESIONY CORRELACION MULTIPLE

dos debida a la regresi6n (SCR) La variacion inexplicada escrita como 2(Yj y)2es la

suma de las desviaciones al cuadrado de las observaciones originales a partir de los valores calculados A esta cantidad se Ie conoce tambien como la suma de cuadrados en torno a la regresiOn 0 la suma del cuadrado de los errores (SCE) Se puede resumir la relashycion entre las tres sumas de cuadrados con la siguiente ecuacion

L(Yj W L(Yj - W + L(Yj - Yj)2 (1041)

SCwtal = SCR + SCE

suma total de cuadrados = suma de cuadrados explicados (debido a la regresion) + suma de cuadrados no explicados (de los errores)

El coeficiente de determinacion multiple R12 k se obtiene al dividir la suma de cuadrados explicados entre la suma total de cuadrados Esto es

R2 = L(Yj - y)2 (1042)y12 L(Yj _ y)2

El subindice y12 k nos seiiala que en el analisis Yes tratada como variable dependiente y que las variables desde Xl hasta X

k son tratadas como variables indeshy

pendientes EI valor de R12k indica que proporcion del total de variacion en los valores de Y observados es explicada por la regresion de Y sobre XI X

2 bull bull X En

otras palabras se dice que R12 k es una medida de bondad de ajuste de la superfishycie de regresion Esta cantidad es analoga a r2 calculada en el capitulo 9

FJEMPLO 1041

Con suite el ejercicio 1031 Ycalcule R12

Solndon Para el ejemplo se tiene en la figura 1031 que

SC = 1489671total

SCR = 118060 SCE 30911

R212 = 118060 = 7925 7930 y 148971

Se puede decir que aproximadamente 793 por ciento del total de la variacion en los valores de Y se explica a traves del plano de regresion ajustado es decir a traves de la relacion lineal con Xl y X2bull bull

Prueba de hip6tesis de ta regresi6n Para determinar si la regresion comshypleta es significativa (es decir para determinar si R212 es trascendente) se puede aplicar la prueba de hipotesis como sigue Y

1 Datos La situacion de la investigacion y los datos generados por el investishygador se examinan para determinar si la regresion multiple es una tecnica

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 487

TABlA 1041 Tabla NOVA para la regresion multiple

Fuente SC gl CM Rv

Debido a la regresi6n Respecto a la regresi6n

SCR SCE

k n-k-l

CMR SCRk CME = SCE(n-k-l)

CMRCME

Total SCtotal

n 1

2 Supuestos Se considera que el modelo de regresi6n multiple y las suposishyciones basicas tal como se presentan en la secci6n 102 son ap1icables

3 Hipotesis En general la hip6tesis nula es Ho P = P == P = Ph 0 y l 2 3 la hip6tesis alternativa es H

A no todas las Pi = O En palabras la hip6tesis nula

afrrma que todas las variables independientes carecen de valor para explicar la variaci6n enlos valores de Y

4 Estadistica de prueba La estadfstica de prueba conveniente es RY que se calcula como parte del analisis de la variancia La tabla AN OVA se muestra en la tabla 10041 En la tabla 10041 CMR simboliza el cuadrado medio debido a la regresi6n y CME simboliza el cuadrado medio respecto a la regresi6n 0

como algunas veces se Ie llama el cuadrado medio del error

5 Distribuci6n de la estadistica de prueba Cuando Ho es verdadera y se cumshyplen las suposiciones RY sigue una distribuci6n F con k y n - k - 1 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de RY es mayor 0

igual que el valor cdtico de F

7 Ca1cular la estadfstica de prueba Vease la tabla 1004 I

8 Decision estadistica Se rechaza 0 no se rechaza Ho de acuerdo con la regIa de decisi6n

9 Conclusion Si se rechaza Ho se concluye que en la poblacion de la que se extr~io la muestra la variable dependiente esta relacionada en forma lineal con las variables independientes como un solo grupo Si no se rechazaHose conshycluye que en la poblacion no existe relacion lineal entre la variable depenshydiente y las variables independientes como un solo grupo

10 El valor de p Se obtiene e1 valorp a partir de la tabla para la distribuci6n F

Con el siguiente ejemplo se muestra el procedimiento de la prueba de hipotesis

F~EMPLO 1042

Se pretende probar la hipotesis nula de que no hay relacion lineal entre las tres variables analizadas en e1 ejemplo 1031 1-450IA2 el numero de cigarros fumados por dfa y el nive1 de cotinina urinaria

Solucion

1 Datos Vease la descripcion de los datos dados en el ejemplo 1031

488 CAPITULO 10 REGRESION Y CORRELACION ~nJLTIPLE

2 Supuestos Se supone que las consideraciones analizadas en la secci6n 102 se cumplen

3 Hipotesis

Ho 13 = 132 0

H A no todas las 13i = 0

4 Estadistica de prueba La estadistica de prueba es Rv 5 Distribucion de Ia prueba estadistica Si Ho es verdadera y las

suposiciones se cumplen la estadistica de prueba sigue una distrishybuci6n F con 2 como numerador y 16 como denominador para los grados de libertad

6 RegIa de decision Se utiliza un nivel trascendente de a OL Por 10 tanto la regIa de decisi6n rechaza Ho si el valor calculado de RV es mayor 0 igual que 623

7 Calculo de la estadistica de prueba En la FIgura 1031 se muesshytra la tabla ANOVA para este ejemplo en la cual se puede ver que RV es igual a 3056

8 Decision estadistica Puesto que 3056 es mayor que 623 se reshychaza Ho

9 Conclusion Se concluye que en la poblaci6n de la cual se extrashyjo la muestra existe relaci6n lineal entre las tres variables

10 Valor de p Puesto que 3056 es mayor que 751 el valor de p para la prueba es menor que 005 bull

Inferencias con respecto a las f3 individuales Por 10 general se pretenshyde evaluar la fuerza de la relaci6n lineal entre Y y las variables independientes de manera individual Es decir se pretende probar la hip6tesis nula 13i 0 contra la hip6tesis alternativa 13

i 0 ( i 12 k) La validez de este procedimiento se apoya

en las suposiciones establecidas previamente para cada combinaci6n de los valores de Xi existe una subpoblaci6n de valores de Y que siguen una distribuci6n nonnal con variancia a2bull

Prueba de hip6tesis para las f3t Para probar la hip6tesis nula de que es igual a algful valor en particular por ejemplo 130 es posible calcular la estadfstica de t

t (1043)

donde los grados de libertad son igual an - k - 1 Y es la desviaci6n estandar de las b

Las desviaciones estandar de las b estan dadas como parte de los resultados de la mayorfa de paquetes de software para computadora que hacen analisis de regresi6n

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 12: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

104 EVAIUACION DE LA ECUACION DE REGRESION MULTIPLE 485

Paciente Y Xl X2 X3 X4 X5 X6

1 105 47 854 175 51 63 33 2 115 49 942 210 38 70 14 3 116 49 953 198 82 72 10 4 117 50 947 201 58 73 99 5 112 51 894 189 70 72 95 6 121 48 995 225 93 71 10 7 121 49 998 225 25 69 42 8 110 47 909 190 62 66 8 9 110 49 892 183 71 69 62

10 114 48 927 207 56 64 35 11 114 47 944 207 53 74 90 12 115 49 941 198 56 71 21 13 114 50 916 205 102 68 47 14 106 45 871 192 56 67 80 15 125 52 1013 219 100 76 98 16 114 46 945 198 74 69 95 17 106 46 870 187 36 62 18 18 113 46 945 190 43 70 12 19 110 48 905 188 90 71 99 20 122 56 957 209 70 75 99

104 EVALUACION DE L ECUACION DE REGRESION MULTIPLE

Antes de utilizar una ecuaci6n de regresi6n multiple para predicci6n y estimaci6n es conveniente determinar primero si de hecho vale la pena utilizarla AI estudiar la regresi6n lineal simple se aprendi6 que puede evaluarse la utili dad de una ecuaci6n de regresi6n considerando el coeficiente de determinaci6n de la muestra y la penshydiente estimada AI evaluar la ecuaci6n de regresi6n multiple la atenci6n se centra en el coeficiente de determinaci6n multiple y los coeficientes de regresi6n parciales

El coeficiente de determinacion mUltiple En el capitulo 9 se estudia con detalle el coeficiente de determinaci6n El concepto se extiende 16gicamente al caso de la regresi6n multiple La variacion total presente en los valores de Y puede dividirshyse en dos componentes la variaci6n explicada que mide la cantidad de la variaci6n total que es explicada por la superficie de regresi6n ajustada y la variaci6n inexplicashyda que es aquella parte de la variaci6n total que no es explicada por el ajuste de la superficie de regresion La medida de la variaci6n en cada caso es una suma de desshyviaciones elevadas al cuadrado La variaci6n total es la surna de desviaciones al cuashydrado de cada observaci6n de Ya partir de la media de las observaciones y se designa por 2(Yj - y)2 0 SC

tata] La variaci6n explicada designada por 2(yj )1)2 es la surna

de las desviaciones al cuadrado de los valores calculados a partir de la media de los val ores de Y observados Esta suma de desviaciones al cuadrado es la suma de cuadrashy

486 CAPITULO 10 REGRESIONY CORRELACION MULTIPLE

dos debida a la regresi6n (SCR) La variacion inexplicada escrita como 2(Yj y)2es la

suma de las desviaciones al cuadrado de las observaciones originales a partir de los valores calculados A esta cantidad se Ie conoce tambien como la suma de cuadrados en torno a la regresiOn 0 la suma del cuadrado de los errores (SCE) Se puede resumir la relashycion entre las tres sumas de cuadrados con la siguiente ecuacion

L(Yj W L(Yj - W + L(Yj - Yj)2 (1041)

SCwtal = SCR + SCE

suma total de cuadrados = suma de cuadrados explicados (debido a la regresion) + suma de cuadrados no explicados (de los errores)

El coeficiente de determinacion multiple R12 k se obtiene al dividir la suma de cuadrados explicados entre la suma total de cuadrados Esto es

R2 = L(Yj - y)2 (1042)y12 L(Yj _ y)2

El subindice y12 k nos seiiala que en el analisis Yes tratada como variable dependiente y que las variables desde Xl hasta X

k son tratadas como variables indeshy

pendientes EI valor de R12k indica que proporcion del total de variacion en los valores de Y observados es explicada por la regresion de Y sobre XI X

2 bull bull X En

otras palabras se dice que R12 k es una medida de bondad de ajuste de la superfishycie de regresion Esta cantidad es analoga a r2 calculada en el capitulo 9

FJEMPLO 1041

Con suite el ejercicio 1031 Ycalcule R12

Solndon Para el ejemplo se tiene en la figura 1031 que

SC = 1489671total

SCR = 118060 SCE 30911

R212 = 118060 = 7925 7930 y 148971

Se puede decir que aproximadamente 793 por ciento del total de la variacion en los valores de Y se explica a traves del plano de regresion ajustado es decir a traves de la relacion lineal con Xl y X2bull bull

Prueba de hip6tesis de ta regresi6n Para determinar si la regresion comshypleta es significativa (es decir para determinar si R212 es trascendente) se puede aplicar la prueba de hipotesis como sigue Y

1 Datos La situacion de la investigacion y los datos generados por el investishygador se examinan para determinar si la regresion multiple es una tecnica

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 487

TABlA 1041 Tabla NOVA para la regresion multiple

Fuente SC gl CM Rv

Debido a la regresi6n Respecto a la regresi6n

SCR SCE

k n-k-l

CMR SCRk CME = SCE(n-k-l)

CMRCME

Total SCtotal

n 1

2 Supuestos Se considera que el modelo de regresi6n multiple y las suposishyciones basicas tal como se presentan en la secci6n 102 son ap1icables

3 Hipotesis En general la hip6tesis nula es Ho P = P == P = Ph 0 y l 2 3 la hip6tesis alternativa es H

A no todas las Pi = O En palabras la hip6tesis nula

afrrma que todas las variables independientes carecen de valor para explicar la variaci6n enlos valores de Y

4 Estadistica de prueba La estadfstica de prueba conveniente es RY que se calcula como parte del analisis de la variancia La tabla AN OVA se muestra en la tabla 10041 En la tabla 10041 CMR simboliza el cuadrado medio debido a la regresi6n y CME simboliza el cuadrado medio respecto a la regresi6n 0

como algunas veces se Ie llama el cuadrado medio del error

5 Distribuci6n de la estadistica de prueba Cuando Ho es verdadera y se cumshyplen las suposiciones RY sigue una distribuci6n F con k y n - k - 1 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de RY es mayor 0

igual que el valor cdtico de F

7 Ca1cular la estadfstica de prueba Vease la tabla 1004 I

8 Decision estadistica Se rechaza 0 no se rechaza Ho de acuerdo con la regIa de decisi6n

9 Conclusion Si se rechaza Ho se concluye que en la poblacion de la que se extr~io la muestra la variable dependiente esta relacionada en forma lineal con las variables independientes como un solo grupo Si no se rechazaHose conshycluye que en la poblacion no existe relacion lineal entre la variable depenshydiente y las variables independientes como un solo grupo

10 El valor de p Se obtiene e1 valorp a partir de la tabla para la distribuci6n F

Con el siguiente ejemplo se muestra el procedimiento de la prueba de hipotesis

F~EMPLO 1042

Se pretende probar la hipotesis nula de que no hay relacion lineal entre las tres variables analizadas en e1 ejemplo 1031 1-450IA2 el numero de cigarros fumados por dfa y el nive1 de cotinina urinaria

Solucion

1 Datos Vease la descripcion de los datos dados en el ejemplo 1031

488 CAPITULO 10 REGRESION Y CORRELACION ~nJLTIPLE

2 Supuestos Se supone que las consideraciones analizadas en la secci6n 102 se cumplen

3 Hipotesis

Ho 13 = 132 0

H A no todas las 13i = 0

4 Estadistica de prueba La estadistica de prueba es Rv 5 Distribucion de Ia prueba estadistica Si Ho es verdadera y las

suposiciones se cumplen la estadistica de prueba sigue una distrishybuci6n F con 2 como numerador y 16 como denominador para los grados de libertad

6 RegIa de decision Se utiliza un nivel trascendente de a OL Por 10 tanto la regIa de decisi6n rechaza Ho si el valor calculado de RV es mayor 0 igual que 623

7 Calculo de la estadistica de prueba En la FIgura 1031 se muesshytra la tabla ANOVA para este ejemplo en la cual se puede ver que RV es igual a 3056

8 Decision estadistica Puesto que 3056 es mayor que 623 se reshychaza Ho

9 Conclusion Se concluye que en la poblaci6n de la cual se extrashyjo la muestra existe relaci6n lineal entre las tres variables

10 Valor de p Puesto que 3056 es mayor que 751 el valor de p para la prueba es menor que 005 bull

Inferencias con respecto a las f3 individuales Por 10 general se pretenshyde evaluar la fuerza de la relaci6n lineal entre Y y las variables independientes de manera individual Es decir se pretende probar la hip6tesis nula 13i 0 contra la hip6tesis alternativa 13

i 0 ( i 12 k) La validez de este procedimiento se apoya

en las suposiciones establecidas previamente para cada combinaci6n de los valores de Xi existe una subpoblaci6n de valores de Y que siguen una distribuci6n nonnal con variancia a2bull

Prueba de hip6tesis para las f3t Para probar la hip6tesis nula de que es igual a algful valor en particular por ejemplo 130 es posible calcular la estadfstica de t

t (1043)

donde los grados de libertad son igual an - k - 1 Y es la desviaci6n estandar de las b

Las desviaciones estandar de las b estan dadas como parte de los resultados de la mayorfa de paquetes de software para computadora que hacen analisis de regresi6n

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 13: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

486 CAPITULO 10 REGRESIONY CORRELACION MULTIPLE

dos debida a la regresi6n (SCR) La variacion inexplicada escrita como 2(Yj y)2es la

suma de las desviaciones al cuadrado de las observaciones originales a partir de los valores calculados A esta cantidad se Ie conoce tambien como la suma de cuadrados en torno a la regresiOn 0 la suma del cuadrado de los errores (SCE) Se puede resumir la relashycion entre las tres sumas de cuadrados con la siguiente ecuacion

L(Yj W L(Yj - W + L(Yj - Yj)2 (1041)

SCwtal = SCR + SCE

suma total de cuadrados = suma de cuadrados explicados (debido a la regresion) + suma de cuadrados no explicados (de los errores)

El coeficiente de determinacion multiple R12 k se obtiene al dividir la suma de cuadrados explicados entre la suma total de cuadrados Esto es

R2 = L(Yj - y)2 (1042)y12 L(Yj _ y)2

El subindice y12 k nos seiiala que en el analisis Yes tratada como variable dependiente y que las variables desde Xl hasta X

k son tratadas como variables indeshy

pendientes EI valor de R12k indica que proporcion del total de variacion en los valores de Y observados es explicada por la regresion de Y sobre XI X

2 bull bull X En

otras palabras se dice que R12 k es una medida de bondad de ajuste de la superfishycie de regresion Esta cantidad es analoga a r2 calculada en el capitulo 9

FJEMPLO 1041

Con suite el ejercicio 1031 Ycalcule R12

Solndon Para el ejemplo se tiene en la figura 1031 que

SC = 1489671total

SCR = 118060 SCE 30911

R212 = 118060 = 7925 7930 y 148971

Se puede decir que aproximadamente 793 por ciento del total de la variacion en los valores de Y se explica a traves del plano de regresion ajustado es decir a traves de la relacion lineal con Xl y X2bull bull

Prueba de hip6tesis de ta regresi6n Para determinar si la regresion comshypleta es significativa (es decir para determinar si R212 es trascendente) se puede aplicar la prueba de hipotesis como sigue Y

1 Datos La situacion de la investigacion y los datos generados por el investishygador se examinan para determinar si la regresion multiple es una tecnica

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 487

TABlA 1041 Tabla NOVA para la regresion multiple

Fuente SC gl CM Rv

Debido a la regresi6n Respecto a la regresi6n

SCR SCE

k n-k-l

CMR SCRk CME = SCE(n-k-l)

CMRCME

Total SCtotal

n 1

2 Supuestos Se considera que el modelo de regresi6n multiple y las suposishyciones basicas tal como se presentan en la secci6n 102 son ap1icables

3 Hipotesis En general la hip6tesis nula es Ho P = P == P = Ph 0 y l 2 3 la hip6tesis alternativa es H

A no todas las Pi = O En palabras la hip6tesis nula

afrrma que todas las variables independientes carecen de valor para explicar la variaci6n enlos valores de Y

4 Estadistica de prueba La estadfstica de prueba conveniente es RY que se calcula como parte del analisis de la variancia La tabla AN OVA se muestra en la tabla 10041 En la tabla 10041 CMR simboliza el cuadrado medio debido a la regresi6n y CME simboliza el cuadrado medio respecto a la regresi6n 0

como algunas veces se Ie llama el cuadrado medio del error

5 Distribuci6n de la estadistica de prueba Cuando Ho es verdadera y se cumshyplen las suposiciones RY sigue una distribuci6n F con k y n - k - 1 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de RY es mayor 0

igual que el valor cdtico de F

7 Ca1cular la estadfstica de prueba Vease la tabla 1004 I

8 Decision estadistica Se rechaza 0 no se rechaza Ho de acuerdo con la regIa de decisi6n

9 Conclusion Si se rechaza Ho se concluye que en la poblacion de la que se extr~io la muestra la variable dependiente esta relacionada en forma lineal con las variables independientes como un solo grupo Si no se rechazaHose conshycluye que en la poblacion no existe relacion lineal entre la variable depenshydiente y las variables independientes como un solo grupo

10 El valor de p Se obtiene e1 valorp a partir de la tabla para la distribuci6n F

Con el siguiente ejemplo se muestra el procedimiento de la prueba de hipotesis

F~EMPLO 1042

Se pretende probar la hipotesis nula de que no hay relacion lineal entre las tres variables analizadas en e1 ejemplo 1031 1-450IA2 el numero de cigarros fumados por dfa y el nive1 de cotinina urinaria

Solucion

1 Datos Vease la descripcion de los datos dados en el ejemplo 1031

488 CAPITULO 10 REGRESION Y CORRELACION ~nJLTIPLE

2 Supuestos Se supone que las consideraciones analizadas en la secci6n 102 se cumplen

3 Hipotesis

Ho 13 = 132 0

H A no todas las 13i = 0

4 Estadistica de prueba La estadistica de prueba es Rv 5 Distribucion de Ia prueba estadistica Si Ho es verdadera y las

suposiciones se cumplen la estadistica de prueba sigue una distrishybuci6n F con 2 como numerador y 16 como denominador para los grados de libertad

6 RegIa de decision Se utiliza un nivel trascendente de a OL Por 10 tanto la regIa de decisi6n rechaza Ho si el valor calculado de RV es mayor 0 igual que 623

7 Calculo de la estadistica de prueba En la FIgura 1031 se muesshytra la tabla ANOVA para este ejemplo en la cual se puede ver que RV es igual a 3056

8 Decision estadistica Puesto que 3056 es mayor que 623 se reshychaza Ho

9 Conclusion Se concluye que en la poblaci6n de la cual se extrashyjo la muestra existe relaci6n lineal entre las tres variables

10 Valor de p Puesto que 3056 es mayor que 751 el valor de p para la prueba es menor que 005 bull

Inferencias con respecto a las f3 individuales Por 10 general se pretenshyde evaluar la fuerza de la relaci6n lineal entre Y y las variables independientes de manera individual Es decir se pretende probar la hip6tesis nula 13i 0 contra la hip6tesis alternativa 13

i 0 ( i 12 k) La validez de este procedimiento se apoya

en las suposiciones establecidas previamente para cada combinaci6n de los valores de Xi existe una subpoblaci6n de valores de Y que siguen una distribuci6n nonnal con variancia a2bull

Prueba de hip6tesis para las f3t Para probar la hip6tesis nula de que es igual a algful valor en particular por ejemplo 130 es posible calcular la estadfstica de t

t (1043)

donde los grados de libertad son igual an - k - 1 Y es la desviaci6n estandar de las b

Las desviaciones estandar de las b estan dadas como parte de los resultados de la mayorfa de paquetes de software para computadora que hacen analisis de regresi6n

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 14: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 487

TABlA 1041 Tabla NOVA para la regresion multiple

Fuente SC gl CM Rv

Debido a la regresi6n Respecto a la regresi6n

SCR SCE

k n-k-l

CMR SCRk CME = SCE(n-k-l)

CMRCME

Total SCtotal

n 1

2 Supuestos Se considera que el modelo de regresi6n multiple y las suposishyciones basicas tal como se presentan en la secci6n 102 son ap1icables

3 Hipotesis En general la hip6tesis nula es Ho P = P == P = Ph 0 y l 2 3 la hip6tesis alternativa es H

A no todas las Pi = O En palabras la hip6tesis nula

afrrma que todas las variables independientes carecen de valor para explicar la variaci6n enlos valores de Y

4 Estadistica de prueba La estadfstica de prueba conveniente es RY que se calcula como parte del analisis de la variancia La tabla AN OVA se muestra en la tabla 10041 En la tabla 10041 CMR simboliza el cuadrado medio debido a la regresi6n y CME simboliza el cuadrado medio respecto a la regresi6n 0

como algunas veces se Ie llama el cuadrado medio del error

5 Distribuci6n de la estadistica de prueba Cuando Ho es verdadera y se cumshyplen las suposiciones RY sigue una distribuci6n F con k y n - k - 1 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de RY es mayor 0

igual que el valor cdtico de F

7 Ca1cular la estadfstica de prueba Vease la tabla 1004 I

8 Decision estadistica Se rechaza 0 no se rechaza Ho de acuerdo con la regIa de decisi6n

9 Conclusion Si se rechaza Ho se concluye que en la poblacion de la que se extr~io la muestra la variable dependiente esta relacionada en forma lineal con las variables independientes como un solo grupo Si no se rechazaHose conshycluye que en la poblacion no existe relacion lineal entre la variable depenshydiente y las variables independientes como un solo grupo

10 El valor de p Se obtiene e1 valorp a partir de la tabla para la distribuci6n F

Con el siguiente ejemplo se muestra el procedimiento de la prueba de hipotesis

F~EMPLO 1042

Se pretende probar la hipotesis nula de que no hay relacion lineal entre las tres variables analizadas en e1 ejemplo 1031 1-450IA2 el numero de cigarros fumados por dfa y el nive1 de cotinina urinaria

Solucion

1 Datos Vease la descripcion de los datos dados en el ejemplo 1031

488 CAPITULO 10 REGRESION Y CORRELACION ~nJLTIPLE

2 Supuestos Se supone que las consideraciones analizadas en la secci6n 102 se cumplen

3 Hipotesis

Ho 13 = 132 0

H A no todas las 13i = 0

4 Estadistica de prueba La estadistica de prueba es Rv 5 Distribucion de Ia prueba estadistica Si Ho es verdadera y las

suposiciones se cumplen la estadistica de prueba sigue una distrishybuci6n F con 2 como numerador y 16 como denominador para los grados de libertad

6 RegIa de decision Se utiliza un nivel trascendente de a OL Por 10 tanto la regIa de decisi6n rechaza Ho si el valor calculado de RV es mayor 0 igual que 623

7 Calculo de la estadistica de prueba En la FIgura 1031 se muesshytra la tabla ANOVA para este ejemplo en la cual se puede ver que RV es igual a 3056

8 Decision estadistica Puesto que 3056 es mayor que 623 se reshychaza Ho

9 Conclusion Se concluye que en la poblaci6n de la cual se extrashyjo la muestra existe relaci6n lineal entre las tres variables

10 Valor de p Puesto que 3056 es mayor que 751 el valor de p para la prueba es menor que 005 bull

Inferencias con respecto a las f3 individuales Por 10 general se pretenshyde evaluar la fuerza de la relaci6n lineal entre Y y las variables independientes de manera individual Es decir se pretende probar la hip6tesis nula 13i 0 contra la hip6tesis alternativa 13

i 0 ( i 12 k) La validez de este procedimiento se apoya

en las suposiciones establecidas previamente para cada combinaci6n de los valores de Xi existe una subpoblaci6n de valores de Y que siguen una distribuci6n nonnal con variancia a2bull

Prueba de hip6tesis para las f3t Para probar la hip6tesis nula de que es igual a algful valor en particular por ejemplo 130 es posible calcular la estadfstica de t

t (1043)

donde los grados de libertad son igual an - k - 1 Y es la desviaci6n estandar de las b

Las desviaciones estandar de las b estan dadas como parte de los resultados de la mayorfa de paquetes de software para computadora que hacen analisis de regresi6n

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 15: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

488 CAPITULO 10 REGRESION Y CORRELACION ~nJLTIPLE

2 Supuestos Se supone que las consideraciones analizadas en la secci6n 102 se cumplen

3 Hipotesis

Ho 13 = 132 0

H A no todas las 13i = 0

4 Estadistica de prueba La estadistica de prueba es Rv 5 Distribucion de Ia prueba estadistica Si Ho es verdadera y las

suposiciones se cumplen la estadistica de prueba sigue una distrishybuci6n F con 2 como numerador y 16 como denominador para los grados de libertad

6 RegIa de decision Se utiliza un nivel trascendente de a OL Por 10 tanto la regIa de decisi6n rechaza Ho si el valor calculado de RV es mayor 0 igual que 623

7 Calculo de la estadistica de prueba En la FIgura 1031 se muesshytra la tabla ANOVA para este ejemplo en la cual se puede ver que RV es igual a 3056

8 Decision estadistica Puesto que 3056 es mayor que 623 se reshychaza Ho

9 Conclusion Se concluye que en la poblaci6n de la cual se extrashyjo la muestra existe relaci6n lineal entre las tres variables

10 Valor de p Puesto que 3056 es mayor que 751 el valor de p para la prueba es menor que 005 bull

Inferencias con respecto a las f3 individuales Por 10 general se pretenshyde evaluar la fuerza de la relaci6n lineal entre Y y las variables independientes de manera individual Es decir se pretende probar la hip6tesis nula 13i 0 contra la hip6tesis alternativa 13

i 0 ( i 12 k) La validez de este procedimiento se apoya

en las suposiciones establecidas previamente para cada combinaci6n de los valores de Xi existe una subpoblaci6n de valores de Y que siguen una distribuci6n nonnal con variancia a2bull

Prueba de hip6tesis para las f3t Para probar la hip6tesis nula de que es igual a algful valor en particular por ejemplo 130 es posible calcular la estadfstica de t

t (1043)

donde los grados de libertad son igual an - k - 1 Y es la desviaci6n estandar de las b

Las desviaciones estandar de las b estan dadas como parte de los resultados de la mayorfa de paquetes de software para computadora que hacen analisis de regresi6n

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 16: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

104 EV ALUACION DE LA ECUACION DE REGRESION MULTIPLE 489

EJEMPLO 1043

Consulte el ejemplo 1031 para probar la hip6tesis nula que dice que el numero de cigarros fumados por dfa (cigdfa) es irrelevante para predecir la variable Indice IA2

Solucion

1 Datos Vease el ejemplo 1031

2 Supuestos Vease la secci6n 102

3 Hipotesis

Ho ~1 = 0

H A ~1 0 Sea ex = 05

4 Estadistica de prueba Vease la ecuaci6n 1043

5 Distribucion de Ia estadistica de prueba Si Ho es verdadera y las suposiciones se cumplen la estadfstica de prueba sigue una disshytribuci6n t de Student con 16 grados de libertad

6 RegIa de decision Se rechaza Ho si el valor calculado de t es mayor 0 igual que 211990 menor 0 igual a -21199

7 Calculo de Ia estadistica de prueba Con la ecuaci6n 1043 Y los datos de la figura 1031 se calcula

t=b1-0= -05169=_74

Sb 06950

8 Decision estadistica No se rechaza la hip6tesis nula porque el valor calculado para t -74 esta entre -21199 y +21199 los valoshyres crfticos de t para la prueba bilateral cuando ex =05 Y se tienen 16 grados de libertad

9 Conclusion Se concluye asf que probablemente no es significashytiva la relaci6n lineal entre Indice IA2 y el numero de cigarros fushymados por dfa en presencia de un nivel de cotinina urinaria AI menos estos datos no ofrecen evidencia que sugiera tal relaci6n Es decir los datos de la muestra no ofrecen suficiente prueba para indicar que los cigarros fumados por dfa cuando se utiliza en la ecuaci6n de regresi6n junto con el nivel de cotinina urinashyria sea una variable util para predecir la variable Indice IA2

10 Valordep Para esta pruebap gt 2(10)=20 bull

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 17: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

490 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Ahora se apliea una prueba similar para el segundo eoefieiente de regresi6n parshycial ~2

Ho ~2 = 0 H A ~2t 0 Sea ex = 05

t = b2 - 0 = -1702 565 51gt 03013

En este easo se reehaza la hip6tesis nula porque 565 es mayor que 21199 Se eoncluye que existe relaci6n lineal entre el nivel de cotinina urinaria y el indice IA2 en la presencia del numero de cigarros fumados por dia y que el nivel de cotinina urinaria utilizado de esta manera es una variable util para predecir el Indice IA2 (Para esta pruebap lt 2(005) 01)

lntervalos de conianza para f3i

Cuando el investigador ha concluido que un coeficiente de regresi6n parcial no es igual a 0 puede ser que tenga interes en obtener un intervalo de confianza para los coefidentes ~i Los intervalos de conshyfianza para ~i pueden construirse de la manera usual mediante los valores de la distribuci6n t para el factor de confiabilidad y los errores estimdar dados arriba

Un intervalo de confianza de 100(1 - ex) por dento para ~i esta dado por

Para este ejemplo puede calcularse el siguiente intervalo de confianza de 95 por dento para ~2

1702plusmn (21199)(03013)

1702 plusmn 063872587

1063 2341

Es posible dar a este intervalo las interpretaciones probabilfstica y praetica habituashyles Se tiene 95 por ciento de confianza de que ~2 esta contenido en el intervalo entre 1063 y 2341 ya que al repetir el muestreo 95 por dento de los intervalos que pueden construirse de esta forma incluiran el parametro verdadero

Algunos precauciones Debe tenerse cui dado con los problemas que se preshysentan al llevar a cabo pruebas de hip6tesis multiples y al construir intervalos de confianza multiples a partir de los mismos datos de la muestra El efecto sobre ex al efectuar pruebas de hip6tesis multiples a partir de los mismos datos se estudia en la secci6n 82 Surge un problema similar ruando se desea eonstruir intervalos de eonfianza para dos 0 mas coeficientes de regresi6n parcial Los intervalos no seran independientes de modo que en general no se aplica el eoeficiente de confianza tabulado En otras palabras todos estos intervalos no serfan intervalos de confianza de 100(1 - ex) por ciento

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 18: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

491 105 usa DE LA ECUACION DE REGRESION MULTIPLE

Otro problema que a veces se encuentra en la aplicacion de la regresion multishyple es la incompatibilidad aparente en los resultados de las diferentes pruebas de significacion que pueden efectuarse En un problema dado para cierto nivel de signishyficacion es posible observar una de las siguientes situaciones

1 R2 Y todas las bi

son significativos

2 R2 Y algunas pero no todas las bi son significativas

3 R2 es significativo pero ninguna b es significativa

4 Todas las bi son significativas pero no R2

5 Algunas bi son significativas pero no todas ni R2

6 No son significativos R2 ni ninguna bibull

Observe que la situacion 2 se presenta en el ejemplo ilustrativo donde se tiene un R2 significativo pero solo uno de los dos coeficientes de regresi6n es signishyficativo Esta situacion es muy comun especial mente cuando se ha incluido un gran numero de variables independientes en la ecuaci6n de regresi6n y el unieo problema es decidir si se elimina 0 no del analisis una 0 mas de las variables asociashydas con coeficientes no significativos

EJERCICIOS

1041 Con los datos del ejercicio 103 I a) calcule el coeficiente de determinacion mUltiple b) aplique el anaJisis de la variancia c) pruebe la significacion para cada b

i (i gt 0) Sea a 05

para todas las pruebas de significacion Determine el valor de ppara todas las pruebas

1042 Con los datos del ejercicio 1032 efectue e] mismo an31isis sugerido en el ejercicio 101 I

1043 Con los datos del ejercicio 1033 efectue el mismo anaJisissugerido en el ejercicio 1011

1044 Con los datos del ejercicio 1031 efecrue el mismo analisis sugerido en el ejercicio 1041

1045 Con los datos del ejercicio 1035 efecrue el mismo anaJisis sugerido en el ejercicio 1011

1046 Con los datos del ejercicio 1036 efectile el mismo analisis sugerido en el ejercicio 1041

105 USO DE IA ECUACION DE REGRESION MULTIPLE

En el capitulo 9 se menciona que la ecuaci6n de regresi6n se utiliza para calcular el valor de Y y dado un valor particular de X De forma amiloga se puede hacer 10 mismo con la ecuaci6n de regresi6n multiple para obtener un valor y dados los valores especificos para dos 0 mas variables X en la ecuaci6n

Igual que en e1 caso de la regresi6n lineal simple en la regresi6n multiple es posible interpretar el valor yen una de dos formas Primero ypuede interpreshytarse como la estimaci6n de la media de la subpoblaci6n de los valores de Y que se

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 19: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

492 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

supone que existen para combinaciones particulares de valores X De acuerdo con esta interpretacion yes una estimaci6n y cuando se utiliza para este proposito ala ecuacion se Ie llama ecuaci6n de estimaci6n La segunda interpretacion indica que yes el valor que mas probablemente asumira Y para los valores dados de las Xi En este caso y es el valor pronosticado 0 valor de predicci6n de Y y a la ecuacion se Ie llama ecuaci6n de predicshyci6n En ambos casos los intervalos se construyen en funcion del valor y cuando la suposicion de normalidad de la seccion 102 se cumple Cuando y se interpreta como una estimacion de la media de la poblacion al intervalo se Ie llama intervalo de confianw y cuando y se interpreta como un valor de prediccion de Y al intervalo se Ie llama intervalo de predicci6n A continuacion se explica como construir cada uno de estos intershyvalos

Intervalo de confiana para la media de una tlubpoblaci6n de valoshyres de Y dados valores esp~qicos de X Como se ha visto es posible construir un intervalo de confianza de 100(1 a) para un parametro mediante el procedimiento general de sumar y restar del estimador una cantidad igual al factor de confiabilidad correspondiente 1 - a multiplicado por el error estandar del estishymador Tambien se ha visto que en esta situacion el estimador es

(1051)

Si se designa el error estandar de este estimador por S7 el intervalo de confianza de 100(1 a) por ciento para la media de Y dados losvalores especfficos de Xi es como sigue

(1052)

Intervalo depredicci6npara un valor especqico de Y dados valores especqicos deX Cuando yse interpreta como el valor que mas probablemenshyte asumira Y cuando se observan valores espedficos de Xi es posible construir un intervalo de prediccion de la misma forma que se construye el intervalo de confianshyza La (mica diferencia es el error estandar El error estandar de la prediccion es un poco mayor que el error estandar de la estimacion 10 que causa que el intervalo de prediccion sea mas amplio que el intervalo de confianza

Si se designa al error estandar de la prediccion por s el interval0 de predicshycion de 1OO( 1 a) por ciento es

(1053)

Los calculos de Sv Ys~en el caso de la regresion multiple son complicados y no se analizan en este texto El estudiante que desee conocer como se cakulan estas estashydfsticas pueden consultar ellibro de Anderson y Bancroft (3) otras obras anotadas al final de este capitulo y el capitulo anterior y las ediciones previas de este texto El siguiente ejemplo muestra como utilizar el paquete MINITAB para obtener los intervalos de confianza para la media de Y y los intervalos de prediccion para valoshyres especfficos de Y

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 20: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

EJERCICIOS 493

FJEMPLO 1051

Utilice como referenda el ejemplo 1031 Primero construya un intervalo de conshyfianza de 95 por dento para el Indice IA2 medio (Y) en una poblacion de indivishyduos que fuman 12 cigarros por dia (Xl) y dene niveles de cotinina urinaria (X

2) de

10 Segundo considere que se tiene un individuo que fuma 12 cigarros por dia y tiene un nivel de cotinina urinaria de 1o ~Que predicci6n del Indice IA2 se puede hacer para este individuo

Soluci6n La estimad6n puntual de la media del Indice IA2 es

y 45234 - 05169(12) + 17020(10) 5605

La prediccion puntual que es el mismo valor que se obtuvo para la estishymacion puntual es

y 45234 - 05169(12) + 17020(10) = 5605

Para obtener el intervalo de confianza y el intervalo de predicd6n de los panimetros para los que se acaba de calcular la estimad6n punshytual y la predicci6n puntual se udliza el paquete MINITAB de la siguienshyte man era Despues de incorporar la informacion para el amilisis de regresi6n de los datos que se muestran en la figura 1031 se hace elic en Options en la caja de dialogo En la caja identificada como Prediction intervals for new observations se teclea 12 y 10 luego se hace elic en OK dos veces Ademas de obtener la regresion lineal se obdenen los siguientes resultados

950 Cr 950 PI (4724 6486) (2529 8681)

Estos intervalos se interpretan de la manera acostumbrada Primero se observa el intervalo de confianza Se tiene 95 por dento de confianza de que el intervalo que va de 4724 hasta 6486 ineluye la media de la subpoblacion de los valores de Y para la combinadon espedfica de los valores de Xi porque este parametro seria ineluido en 95 por dento de los intervalos que pueden construirse de la manera mostrada

Ahora considere al individuo que fuma 12 cigarros por dfa y tienen un nivel lOde cotinina urinaria Se tiene 95 por ciento de confianza de que este individuo puede tener un Jndice IA2 con un valor entre 2529 y 8681 bull

FJERCICIOS

Para cada uno de los siguientes ejercicios calcule el valor de y y elabore a) intervalos de confianza de 95 por ciento y b) intervalos de prediccion de 95 por ciento de xi

1051 Utilice como referencia el ejercicio 1031 Sea Xlj = 200 Y x2j=20

1052 Utilice como referencia el ejercicio 1032 Sea xli = 50 x2j = 30 Y x3j = 25

1053 Utilice como referencia eI ejercicio 1033 Sea xli = 5 Y = 6

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 21: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

494 CAPITULO 10 REGRESIONY CORRELACIONMULTIPLE

1054 Utilice como referencia el ejercicio 1034 Sea xlj = 1 Y x2) = 2

1055 Utilice como referencia el ejercicio 1035 Sea Xl 90 Y x2j =80

1056 Utilice como referencia el ejercicio 1036 Sea Xl) 50 x2j = 950 X = 200 x = 600 XSj 4j Sj 75 Yx6j = 70

106 MODELO DE CORREIACION MULTIPLE

En el capftulo anterior se indica que mientras el anaIisis de regresion se refiere a la forma de relacion entre las variables el objetivo del analisis de correlacion es conoshycer acerca de la intensidad de la relacion Esto ocurre tambien en el caso de variashybles multiples yen esta seccion se investigan los metodos para medir la intensidad de la relacion entre diversas variables Sin embargo deben definirse primero el modelo y las suposiciones sobre las cuales se basa el analisis

ECIUlCioll del modelo Puede escribirse el modelo de correlacion como

(1061)

donde Yj es el valor representativo de la poblacion de valores de la variable Y los valores de ~ son los coeficientes de regresion definidos en la seccion 102 Y los Xi son los valores particulares (conocidos) de las variables aleatorias Xi Este modero es semejante al modelo de regresion multiple pem existe una diferencia importante En el modelo de regresion multiple dado en la ecuaci6n 1021 las Xi son variables no aleatorias pem en el modelo de correlaci6n multiple las Xi son variables aleatorias En otras palabras en el modelo de correlacion existe una distribucion con junta de Y y las Xi a la que se conoce como distribuci6n multivariada En este modelo las variables ya no se considerancomo dependientes 0 independientes ya que logicamente son intercambiables y cualesquiera de las Xi puede desempefiar la funcion de Y

De manera representativa se extraen muestras aleatorias de unidades de asociashyci6n a partir de una poblacion de interes y se efectuan mediciones de Y y de las Xi

Un plano 0 hiperplano de minimos cuadrados se ajusta a los datos de la muestra a traves de los metodos descritos en la secci6n 103 y pueden hacerse los mismos usos de la ecuacion que resulte Pueden hacerse inferencias acerca de la pohlacion de la cual se extrajo la muestra si es posible suponer que la distribucion fundamental es normal es decir si puede suponerse que la distribucion con junta de Y y las Xi siguen una distnbucion norrnal multivariada Ademas es posible calcular medidas muestrales del grado de relacion entre las variables y con la suposicion de que el IIuestreo se realiza a partir de una distribucion normal de variables multiples puedeh estimarshyse los parametros correspondientes por medio de intervalos de confianza y pueden llevarse a cabo pruebas de hip6tesis Especfficamente es posible calcular una estishyf1acion del coeficiente de correlacion multiple que mide la dependencia entre Y y las Xi Esta es una extension directa del concepto de correlacion entre dos variables que se estudia en el capitulo 9 Tambien es posible calcular los coeficientes de correlacion parcial que miden la intensidad de la relacion entre dos variables cualesquiera cuando ha sido eliminado el efecto de todas las demas variables

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 22: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

495 106 MODELO DE CORRElACI6N MULTIPLE

Coejiciente de correlacion multiple Como primer paso para el analisis de las relaciones entre las variables se estudia el coeficiente de correlaci6n multiple

EI coeficiente de correlaci6n multiple es la rafz cuadrada del coeficiente de determinaci6n y en consecuencia el valor de la muestra se calcula mediante la rafz cuadrada de la ecuaci6n 1042 Es decir

LCy y)2 Ry12k = ~R12 k (1062)L(Yj - y)2

Se considera el siguiente ejemplo para ilustrar los conceptos y las tecnicas del analisis de correlaci6n multiple

FJEMPLO 1061

Benowitz et al (A-4) se dieron cuenta de que entender la disposici6n cinetica y la biodisponibilidad a partir de diferentes rutas de exposici6n es la parte medular para comprender la dependencia de nicotina y el uso racional de la nicotina como medicamento Los investigadores publicaron su descubrimiento respecto a este feshyn6meno y los resultados en la revista Clinical Pharmacology amp Therapeutics Los indishyviduos estudiados eran hombres sanos con edades entre 24 y 48 alios que fumaban cigarros con regularidad Entre los datos recolectados para cada individuo esta el numero de aspiraciones por cigarro el total de partfculas de materia por cigarro yel consumo de nicotina por cigarro Los datos anotados en la tabla 1061 coshyrresponden a nueve individuos Se pretende analizar la naturaleza y la intensidad de las relaciones entre estas tres variables

TABLA 1061 Datos relacionados con el habito de fnOlalmiddot para nneve individnos

Xl X2 Y

75 219 138 90 464 178 85 240 168

100 288 212 145 438 326 110 481 298 90 508 256

120 478 347 140 491 322

XI aspiracionescigarro X2 = total de partfculas de mateshyria (mgcigarro fumado) Y = nicotina consumida cigarro (mg) FUENTE Neal L Benowitz Peyton Jacob III Charles Denaro y Roger Jenkins Stable Isotope Studies ofNicotine Kinetics and Biovailability Clinical PJuzfllUlcology amp Therapeutics 49 270-277

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 23: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

496 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Solucion Para analizar los datos de este ejercicio se utiliza el paquete MINITAB Ellector interesado en la deducci6n de las formulas y el procedimiento aritmetico asociado puede consultar los textos que se mencionan al final de este capitulo y el anterior as como las ediciones previas de este texto Si se quiere una ecuaci6n de prediccion calculada por mfnimos cuadrashydos y un coeficiente de correlaci6n multiple como parte del analisis esto se puede lograr mediante el procedimiento de regresi6n multiple de MINITAB descrito con anterioridad Cuando se pretende hacer esto con los valores muestrales de XI X2 YYalmacenados en las columnas 12 Y 3 respectivamente se obtienen los resultados que se muestran en la figura 1061

La ecuaci6n de minimos cuadrados es

Esta ecuaci6n puede calcularse mediante los metodos descritos en la seccion 104 y emplearse para efectuar estimaciones y predicciones

Tal como se aprecia en la figura lO61 los resultados de la regreshysi6n multiple tambien producen el coeficiente de determinaci6n multishyple que para este ejemplo es

Rl2 =865

Por 10 tanto el coeficiente de correlaci6n multiple es

Ry12 =)865 =93

The regression equation is y - 0751 + 0211 Xl + 00252 X2

Predictor Coef Stdev t-ratio p Constant -07505 05349 -140 0210 xl 021078 005732 368 0010 X2 002516 001208 208 0082

s = 03301 R-sq = 865 R-sq(adj) = 821

Analysis of Variance

SOURCE DF SS MS F P Regression 2 42064 21032 1930 0002 Error 6 06538 01090 Total 8 48602

FIGURA1061 Resultados del procedirniento de regresi6n multiple del paquete MINITAB para los datos de la tabla 1061

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 24: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

497 106 MODELO DE CORRELACION MULTIPLE

Interpretaci6n de R 12 EI coeficiente de correlaci6n multiple se intershypreta como una medlda de la correlad6n entre las variables consumo de nicotina por cigarro numero de fumadas por dgarro y total de particushylas problema de materia por cigarro en la muestra de nueve varones sanos con edades entre 24y 48 alios Si los datos forman una muestra aleatoria simple de una poblad6n similar es posible utilizar R 12 como

Y un estimador de P 12 el verdadero coeficiente de correlad6n multiple de la poblaci6n Timbien es posible interpretar a Ry12 como un coefishyciente de correlaci6n simple entre y y ji que son los valores observados y calculados respectivamente paral~ variable dependiente La corresshypondencia perfecta entre los valores observados y los calculados de Y resultara en un coeficiente de correlaci6n de I mientras que la ausencia total de una retad6n lineal entre los valores observados y los calculados producirltin un coeficiente de correlaci6n igual a O Los coefidentes de correlaci6n multiple siempre estan dados con signo positivo

Es posible probar la hip6tesis nula de que Py l2k = 0 con el caIculo de

R 1Lk n-k-1F (1063)

1-R2 k k

EI valor numericb que se obtiene a partir de la ecuaci6n 1063 se comshypara contra el valor tabulado de la distribuci6n F con k y n - k - I grados de libertad Es importante recordar que esto es identico a la prueba de Ho = ~I = ~2 bullbullbull = 1 = 0 descrita en la secci6n 104

Para este ejemplo se prueba la hip6tesis de que P 12 0 contra la hip6tesis alternativa de que P

y 12 =F O El calculo es Y

F= 865 9-2-1 =19222 (1- 865) 2

Puesto que 19222 es mayor que 1454 p lt 005 de tal modo que es posible rechazar la hip6tesis hula en un nivel de significaci6n de 005 y concluir que el consumode nicotina esta linealmente correlacionada con la cantidad de furnadas por cigarro y el total de partfculas de materia por cigarro en la poblaci6n muestreada

El valor calculado de F para probar la hipotesis nula de que el coeflCiente de correlaci6n multiple de la poblaci6n es igual a cero esta dado en la tabla del analisis de la variancia que se muestra en la figura 1061 Y es 1930 Los dos valores calculados de F difieren como resultashydo de las diferencias en el redondeo de los calculos intermedios bull

Correlacionparcial Es posibfe que el investigador desee tener una medida de fa intensidad de la relaci6n lineal entre dos variables cuando se elimina la influencia de las variables restantes Dicha medida fa proporciona el coeficiente de correlaciOn parcial Por ejemplo el coeficiente de correlaci6n parcial ry 12 es unamedida de correlaci6n entre Y y XI despues de controlar el efecto de X2 manteniendo su valor constante

Los coeficientes de correlaci6n parcial pueden calcularse a partir de los coefishycientes de correlaci6n simple Los coeficientes de correlaci6n multiple miden la correshy

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 25: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

498 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

lacion entre dos variables cuando no se pretende controlar otras variables En otras palabras son los coeficientes para cualquier par de variables que se obtienen meshydiante los metodos de correlaci6n simple que se estudian en el capItulo 9

Suponga que se tienen tres variables Y XI YX2bull EI coeficiente de correlaci6n parcial de la mueStra que mide la correlaci6n entre Y YXI despues de controlar el

efecto de X2

por ejemplo se escribe r 12 En el subindice el simbolo a la derecha del punto decimal indica la variable que se mantiene constante mientras que los dos simbolos a la izquierda del punto decimal indican que variablesestan correlashycionadas Para el caso de las tres variables existen OtrOS dos coeficientes de correlacion parcial que pueden calcularse Estos son r y2J r ]12

Coeftciente de determinacion parcial EI cuadrado del coeficiente de coshyrrelaci6n parcial es el coeficiente de determinaci6n parcial Proporciona informacion util acerca de las relaciones entre las variables Cqnsidere a T 12 como ejemplo Su cuadrado TY2 indica que proporci6nde la variabilidad restarite en Yes explicada por XI despues que X2 ha explicado el maximo posible de la variabilidad de Y

Criculo de los coeftcientes de correlacion parcial Para tres variables es posible obtener los siguientes coeficientes de correlaci6n simple

r I la correlacion simple entre Yy XI 2 la correlacion simple entre Y y X2~2 la correlaci6n simple entre XI YX2

EI procedimiento de correlaci6n de MINITAB puede utilizarse para calcular estos coeficientes de correlaci6n simple tal como se muestra en la figura 1062 AI igual que en otros ejercicios las observaciones de las muestras se almacenan en las columnas 1 2 Y3 En la figura 1062 se aprecia que los resultados son r lz=561 r 1=876 Yr 2=middot750 Y Los cdeficientes de correlacion parcial que son calculados a partir de los coefishy

cientes de correlaci6n simple en el caso de las tres variables son

1 La correlaci6n parcial entre Yy Xl despues de mantener constante a X2

(1064)

2 La correlaci6n parcial entre Y y X despues de mantener constante a XIz

(1065)

3 La correlaci6n parcial entre Xl y X2

despues de mantener constante a Y

(l066)

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 26: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

499 106 MODELO DE CORRELACION MULTIPLE

Caja de dialogo Comando de lasesi6n

Statgt Basic Statisticsgt Correlation MTB gt CORRELATION Cl-C3

Teclear Cl-C3 en Variables Clic OK

Resultados

Correlaciones (Pearson)

Xl X2 X2 0561 Y 0876 0750

FIGURA 1062 Procedimiento de MINITAB para calcular 10s4coeficientes de correlaci6n simple para los datos de la tabla 1061

EJEMPLO 1062

Para ilustrar los cilculos de los coeficientes decorrelaci6n parcial dela muestra se tomara en cuenta el ejemplo 1061 para calcular los coefidentes de correlaci6n parcial entre las variables de consumo de nicQtina (y) la cantidad de aspiraciones por cigarro (Xl) y el total de partkulas de materia (X2)

Solucion En lugar de calcular los coefidentes de correlaci6n parcial a partir de las ecuaciones 1064 1065 Y 1066 para realizar el calculo de los coefishycientes de correlaci6n simple se opt6 por utilizar el paquete MINITAB

El procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial esta basado en que un coeficiente de correlaci6n parshycial dado es por S1 mismo la correlaci6n simple entre dos con juntos de residuales El conjunto de residuales se obtiene como sigue Suponga que se tienen mediciones para dos variables X (la variable independienshyte) y Y (la variable dependiente) La ecuaci6n de predicci6n por minishymos cuadi-ados es y a +bx Para cada valor deXse calcula el residual que es iguaTa (Yi - 5i) la diferenciaentre elvaldr observado de Y y el valor de predicci6n de Yasodado tori la variable X

Ahora suponga que se tienen tres variables Xl X2 YY Se pretende calcular los coeficientes de correlaci6n parcial entre Xl y Y mientras X2 se mantiene constante Se hace la regresi6n de Xl sobre X

2bull y se calculan los

residuales para formar el con junto de residualesA Se hace la regresi6n de Y sobre X2 y se calculan los residuales a este conjunto de residuales se Ie llama con junto B El coeficiente de correlaci6n simple que mide la intenshysidad de la relad6n entre los con juntos de residualesA y B es el coeficiente de correlaci6n parcial entre Xl y Y despues de mantener con stante a X2bull

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 27: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

500 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

MTB gt SUBCgt

regress Cl 1 C2i residuals C4

MTB gt SUBCgt

regress C3 1 C2 residuals CS

MTB gt SUBCgt

regress Cl 1 C3 residuals C6

MTB gt SUBCgt

regress C2 1 C3 residuals C7

MTB gt SUBCgt

MTB gt SUBCgt

regress C2 1 Cl r-esiduals C8

regress C3 1 Cl residuals C9

MTB gt corr C4 CS

Correlaciones (Pearson)

Correlation of C4 MTB gt corr C6 C7

and CS 0832

Correlaciones (Pearson)

Correlation of C6 MTB gt corr C8 C9

and C7 -0302

Correlaciones (Pearson)

Correlation of C8 and C9 0648

FIGURA 1063 Procedimiento de MINITAB para calcular los coeficientes de correlaci6n parcial Eon los datos de la tabla 106 J

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 28: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

501 middot 106 MODELO DE CORRELACION MULTIPLE

Cuando se utiliza el paquete MINITAB es posible almacenar cada conjunto de residuales en diferentes colurnnas para futuros calculos de coeshyfidentes de correladon simple entre eHos

Se utilizan mas los comandos de la sesion que 1a caja de dialogo para calcular los coeflCientes de correlacion parcial cuando se utiliza el paquete MINITAB Con las observaciones sobre Xl X2 YYalmacenashydas en las columnas 1 2 Y 3 respectivamente el procedimiento para los datos de la tabla 1061 se muestra en la figura 1063 Los resultados muestran que 832 r l2 y =-302 y r y2l =648 bull

Prueba de hipotesis de los coejicientes de correlacion parcial Es posible probar la hipotesis nula de que cualquiera de los coeficientes de correlashycion parcial de la poblacion es igual a 0 por medio de la prueba t Por ejemplo para probar Ho PyL2k 0 se calcula

n-k 1 (1067)l-r2

ylLLk

la cual sigue una distribucion como la t de Student con n - k - 1 grados de libertad Se ilustra el procedimiento para este ejemplo con la prueba de Ho P

yl

2 = 0

contra la hipotesis alternativa H A Py12 i= O El calculo de t se efectua de la siguiente manera

t=832 19-2-1 36735 ~ 1 8322

Puesto que el valor calculado de t 36735 es mayor que el valor tabulado para t 24469 con 6 grados de libertad y ex = 05 (prueba bilateral) es posible rechazar Ho en el nivel de significadon de 05 y conduir que existe una relacion significativa entre el consurno de nicotina y las aspiraciones por cigarro despues de mantener constante la cantidad total de partfculas de materia por cigarro La prueba de significacion para los otros dos coeficientes de correlacion queda como ejerdcio para ellector

EI paquete de software estadfstico SPSS para PC ofrece un procedimiento conshyveniente para obtener los coefidentes de correladon parcial Para utilizar esta caracshyteristica se selecdona Statistics de la barra del menu despues Correlate y finalmente Partial Despues de esta secuencia de selecciones aparece la caja de dialogo Partial Correlations sobre la pantalla En la caja identificada como Variashybles se escribe el nombre de las variables para las que se desea calcular las correlashyciones parciales En la caja identificada como Controlling for se escriben los nombres de las variables que se desea controlar EI siguiente paso es seleccionar el nivel de significacion bilateral 0 unilateral A menos que la opcion no sea seleccionada los niveles de significadon verdaderos seran desplegados Para el ejemplo 1062 la fishygura 1064 muestra los coeficientes de correlacion parcial calculados con SPSS enshytre las otras dos variables cuando se controla con exito para Xl (fumadascigarro) X

2

(total de partfcu1as de materia) y Y (consumo de nicotinacigarro)

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 29: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

502 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

PARTIAL CORRELATION COEFFICIENTS

Controlling formiddotmiddot Xl

X2 y

X2 10000 6479 ( 0) 6) P= P= 082

y 6479 10000 6) ( 0)

pp= 082

Controlling for X2

y Xl

y 10000 8323 ( 0) ( 6)

P= p= 010

Xl 8323 1 0000 6) ( 0)

P= 010 P=

Controlling for y

Xl X2

Xl 1 0000 -3024 ( 0) (6 ) P= p= 467

X2 3024 1 0000 6) ( 0)

P= 467 P=

Coefficient I (DF ) 12-tailed Significance) is printedif a coefficient cannot becomputed

FIGURA 1064 Coeficientes de corrdaci6n parcial cibtenidos mediante el paquete SPSS para Windows Ejemplo 1062

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 30: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

EJERCICIOS 503

Aunque la ejemplificaci6n del amHisis de correlaci6n esta limitado a situacioshynes de tres variables losconceptos y las tecnicas se extienden 16gicamente a situashyciones con cuatro 0 mas variables El numero y la complejidad de los citlculos aumenta en proporci6n directa al numero de variables

FJERCICIOS

1061 El objetivo de un estudio de Steinhorn y Green (A-5) fue determinar si la respuesta metab6lica ante enfermedades en nifios medida por medios directos esta correlacionada con la graveshydad estimada de la enfermedad Los individuos eran 12 pacientes con edades entre 2 y 120 meses con una gran variedad de enfermedades entre elIas sepsis meningitis bacteriana e insuficiencia respiratoria Se evalu6 la severidad de la enfemedad pormedio del fndice de estabilidad psicol6gica (IEP) y el sistema de calificaci6n del Riesgo de mortalidad pediatrica (RMP) Tambien se obtuvieron calificaciones con en base en el Sistema de calificaci6n de intervenci6n terapeutica (SCIT) y los instrumentos del Sistema de intervenci6n manejo y utilizaci6n de cuidados de enfermerfa (SIMUCE) Los investigadores realizaron mediciones sobre las siguientes variables frecuentemente usadas como marcadores de estres psicol6gishyco total de nitr6geno urinario (TNU) consumo de oxfgeno por minuto (V02) y la proporshyci6n entre cadenas ramificadas y aminoacidos aromaticos (CRAA) Las mediciones resultantes respecto a estas variables son las siguientes

RMP IEP SCIT SIMUCE TNU CRAA(Vdeg2)

150 140 100 80 1460 31 18 270 180 520 100 1710 43 14

50 40 150 80 1210 24 22 230 180 220 80 1850 41 14

40 120 270 80 1300 22 17 60 40 80 80 1010 20 24

180 170 420 80 1270 46 17 150 140 470 90 1610 37 16 120 110 510 90 1450 64 13

10 40 150 70 1160 25 23 500 630 640 100 1900 78 16

90 100 420 80 1350 37 18

FUENTE David M Steinhorn y Thomas P Green Severity ofIlIness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503-1509 Copyright copyWilliarns amp Wilkins

a) Cacule los coeficientes de correlaci6n simple entre todos los pares posibles de variables

b) Calcule el coeficiente de correlaci6n multiple entre las variables SIMUCE TNU Y CRAA Pruebe la significaci6n de todos los coeficientes

c) Calcule las correlaciones parciales entre SIMUCE y cada una de las otras variables espeshycificadas en el inciso b mientras se mantienen constantes las otras dos variables (A estos coeficientes se les llama coeficientes de correlaci6n parcial de segundo orden)

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 31: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

504 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

d) Repita el inciso c con la variable RMP en lugar de SIMUCE

e) Repita el inciso c con la variable IEP en lugar de SIMUCE

f) Repita el inciso c con la variable SCIT en lugar de SIMUCE

1062 Las siguientes mediciones se obtuvieron de 12 hombres con edades entre 12 y 18 aflOS (todas las mediciones estan en centimetros)

Estatura Longitud del radio Longitud del femur (Y) (Xl) (X

2)

1490 2100 4250 1520 2179 4370 1557 2240 4475 1590 2300 4600 1633 2370 4700 1660 2430 4790 1690 2492 4895 1720 2550 4990 1745 2580 5030 1761 2601 5090 1765 2615 5085 1790 2630 5110

Total 1 9921 29087 57385

a) Calcule los coeficientes de correlaci6n mUltiple ypruebe la hip6tesis nula siguiente P12 = o b) Calcule cada uno de los coeficientes de correlaci6n parcial y pruebe la significaci6n de todos los coeficientes Sea a 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las condusiones a las que se lleg6

1063 Los siguientes datos corresponden al peso de 15 jovencitas obesas

Peso corporal Consumo medio Peso en kg magno de calorias por ilia (Y) (Xl) (X )

2

792 543 2670 640 443 820 670 478 1210 784 539 2678 660 475 1205 630 430 815 659 471 1200 631 440 1180 732 441 1850 665 483 1260

(Continua)

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 32: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

EJERCICIOS 505

Peso Peso corporal Consumo medio en kg maxima de calorias por dia (I) (Xl) (X )

2

619 435 1170 725 433 1852

lOLl 664 1790 662 475 1250 999 661 1789

Total 10879 7411 22739

a) Calcule el coeficiente de cOITe1acion multiple y de significacion

b) Calcule cada uno de los coeficientes de correlacion parcial y pruebesu significaci6n indishyvidual Sea a = 05 para todas las pruebas

c) Determine el valor de p para cada prueba

d) Establezca las conclusiones a las que se llego

1064 Se realizo un proyecto de investigaci6n para estudiar las relaciones entre inteligencia afasia y apraxia Los individuos eran pacientes con dafio focal en el hemisferio izquierdo Se obtushyvieron calificaciones para las siguientes variables a traves de la aplicacion de pruebas estandar

X

Y = inteligencia

Xl apraxia ideomotora

X2

= apraxia constructiva

X3 volumen de la lesion (puntos)

4 = gravedad de la afasia

Los resultados se muestran en la siguiente tabla Calcule los coeficientes de correlashycion multiple y realice la prueba de significacion Sea a = 05 Y calcule el valor de p

Individuo Y XXl 2 Xs X4

1 66 76 74 229687 2 2 78 132 119 297582 8 3 79 130 124 283938 11 4 84 142 133 313658 15 5 77 114 112 247050 5 6 82 144 131 313658 9 7 82 133 128 279955 8 8 75 124 119 256550 6 9 81 107 ll5 242949 11

10 71 76 78 236937 6 11 77 112 108 264462 7 12 74 97 97 264745 9 13 77 102 100 267292 7 14 74 101 97 264025 8 15 68 61 72 192660 5

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 33: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

506 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

107 RESUMEN

En este capitulo se estudia c6mo los conceptos y tecnicas para el analisis de correlaci6n y regresi6n lineal simple pueden extenderse a casos de variable multiple Se presenta y ejemplifica el metodo de mfnimos cuadrados para obtener la ecuaci6n de regresion Este capitulo tambien esta relacionado con el calculo de medidas descriptivas pruebas de significaci6n y usa de la ecuaci6n de regresion mUltiple Ademas se estudian los meshytodos y conceptos del analisis de correlacion induyendo la correlaci6n parcial

Cuando los supuestos que fundamentan los metodos de regresi6n y correlaci6n que se presentaron en este capitulo y en el anterior no se cumplen el investigador debe recurrir a otras tecnicas alternativas como las que se estudian en el capitulo 13

~IlEGUNrAS YFJERCICIQS DE REPASO

1 ~Cuales son los supuestos que fundamentan el anilisis de regresi6n multiple cuando se deshysea inferir ace rca de la poblacion de la que se extrae la muestra

2 2Cuales son los supuestos que fund amentan el modelo de correlaci6n cuando la inferencia es un objetivo

3 Explique ampliamente lossiguientes terminos

a) Coeficiente de determinaci6n multiple

b) Coeficiente de correlaci6nmultiple

c) Coeficiente de correlaci6n simple

d) Coeficiente de correlaci6n parcial

4 Describa una situaci6n de un area particular de su interes donde el analisis de regresi6n multiple pueda ser utH Se puede utilizar datos realeso ficticios para hacer el aniilisis de regresi6n completo

5 Describa una situaci6n de un area particular de su interes donde el analisis de correlaci6n multiple pueda ser uti Se puede utilizar datos reales 0 ficticios para hacer el amilisis de regresi6n completo

En los ejercicios del6~111 lleve a cabo el analisis indicado y proebe las hip6tesis de acuerdo con el nivel de significaci6n sefialado Calcule el valor de p para todas las pruebas

6 La siguiente tabla muestra algunos valores de la funci6n pulmonar observados en 10 pacienshytes hospitalizados

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total (Ii tros) segundo

22 25 l6 15 32 10 16 50 14

(Continua)

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 34: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

507 PREGUNTASY EJERCICIOS DE REPASO

(Y) (Xl) (X

2) Volumen espiratorio

Capacidad vital Capacidad pulmonar forzado (litros) por (litros) total(litros) segundo

34 44 26 20 44 12 19 33 15 22 32 16 33 33 23 24 37 21

9 36 7

Calcule el coeficiente de correlaci6n multiple y pruebe con un nivel de significaci6n de 05

7 La siguiente tabla muestra el peso y el nivel total de colesterol y trigliceridos en 15 pacientes con hiperlipoproteinemia primaria de tipo II antes de inciar el tratamiento

(Xl) (X2)

(Y) Colesterol total Trigliceridos Peso (kg) (mgIOO ml) (mgIOO ml)

76 302 139 97 336 101 83 220 57 52 300 56 70 382 113 67 379 42 75 331 84 78 332 186 70 426 164 99 399 205 75 279 230 78 332 186 70 410 160 77 389 153 76 302 139

Calcule el coefidente de correlaci6n multiple y pruebe con un nivel 05 de significaci6n

8 En un estudio de las relaciones entre la excreci6n de creatinina altura y peso se recolectaron los datos que se muestran en la siguiente tabla Los datos corresponden a 20 bebes varones

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 35: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

508 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

Exerecion de ereatinina (mgldia) ~esf) (kg) Estatura (em)

Infante (Y) (Xl) (X2)

1 100 9 72 2 115 10 76 3 52 6 59 4 85 8 68 5 135 10 60 6 58 5 58 7 90 8 70 8 60 7 65 9 45 4 54

10 125 11 83 11 86 7 64 12 80 7 66 13 65 6 61 14 95 8 66 15 25 5 57 16 125 11 81 17 40 5 59 18 95 9 71 19 70 6 62 20 120 10 75

a) Ca1cule la ecuaci6n de regresi6n multiple que describa la relaci6n entre estas variables

b) Ca1cule R2 y haga el analisis de la variancia c) Sea XI = lOy X2 = 60 para ca1cular el valor de predicci6n de Y

9 Un estudio fue conducido para examinar aquellas posibles variables relacionadas con la satisshyfacci6n en el trabajo de los empleados sin un grado profesional de los hospitales Una muesshytra aleatoria de 15 empleados produjo los siguientes resultados

Califieacion respeeto Codigo de Indice de a la satisfaecion en el ealifieacion de adaptacion trabajo inteligencia personal (Y) (X2)

54 15 8 37 13 1 30 15 1 48 15 7 37 10 4 37 14 2 31 8 3

(Continua)

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 36: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

509 PREGUNTAS Y EJERCICIOS DE REPASO

Calificaci6n respecto C6digo de Indice de a la satisfacci6n en el calificaci6n de adaptaci6n trabajo inteligeIicia personal (Y) (XI) (Xl)

49 43 12 30 37 61 31 31

12 1 3

15 14 14 9 4

7 9 1 1 2

10 1 5

a) Calcule la ecuaci6n de regresi6n multiple que describe las relaciones entre estas variables

b) Calcule el coeficiente de detelminaci6n multiple y haga el analisis de la variancia

c) Sea XI = 10 YX2 = 5 para calcular el valor de predicci6n de Y

10 Un equipo de investigaci6n medica obtuvo los indices de adiposidad insulina basal y glucoshysa basal de 21 individuos normales Los resultados se muestran en la siguiente tabla Los investigadores pretendian conocer la intensidad de las relaciones entre estas variables

Indice de Insulina basal Glucosa basal adiposidad OlUmI) (mgllOO mI) (Y) (Xl) (X2)

90 12 98 112 10 103 127 14 101 137 11 102 103 10 90 140 38 108 105 9 100 92 6 101 92 8 92 96 6 91

114 9 95 108 9 95 160 41 117 91 7 101

115 9 86 167 40 106 108 9 84 156 43 117 167 17 99 165 40 104 168 22 85

Calcule el coeficiente de correlaci6n multiple y realice la prueba de significaci6n para un nivel de 05

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 37: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

510 CAPiTULO 10 REGRESIONY CORRELACION MULTIPLE

11 Como parte de un estiidio para investigar las relaciones entre el estres y algunas otras variashybles se recolectaron los siguientes datos de una muestra aleatoria de 15 e~ecutivos industriales a) Calcule la ecuaci6n de regresi6n por minimos ruadrados para estos datos b) Elabore la tabla de analisis de la variancia y pruebe la hip6tesis nula de no relaci6n entre las cinco variables c) Pruebe la hip6tesis nula de que cada pendiente en el modelo de regresi6n es igual a cern d) Calcule el coeficiente de determinaci6n multiple y el coeficiente de correlaci6n multiple Sea a = 05 Y calcule el valor de p

Mediciones Numero de alios Salario Mediciones de de tamalio en el mismo anual estrts fume puesto (xlOOO) Edad (Y) (Xl) (X

2) (Xl) (X4 )

101 812 15 $30 38 60 334 8 20 52 10 377 5 20 27 27 303 10 54 36 89 505 13 52 34 60 401 4 27 45 16 177 6 26 50

184 598 9 52 60 34 412 16 34 44 17 127 2 28 39 78 601 8 42 41

141 297 11 84 58 II 205 4 31 51

104 603 5 38 63 76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios desde el12 a116 responda todas las preguntas posibles

a) ~Que tecnica es mas importante el amHisis de correlaci6n 0 el analisis de regresi6n ~Son

ambas tecnicas igual de importantes

b) ~Cual es la variable dependiente

c) ~CuaIes son las variables independientes

d) ~Cuales son las hip6tesis nula y alternativa adecuadas

e) ~CuaI de las hip6tesis nulas pudiera ser rechazada ~Por que

f) ~Que objetivo es mas importante la predicci6n 0 la estimaci6n (Son ambas igual de importantes Explique la respuesta

g) cCual es la poblaci6n muestreada

h) (Cual es la poblaci6nbbjetivo

i) (Que variables estan relacionadas con cuales otras (Las relaciones son directas 0 inversas

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 38: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

511 PREGliNTAS Y EJERCICIOS DE REPASO

j) Calcule la ecuacion de regresion con el uso de numeros adecuados para estimar los parashymetros k) cCual es el valor numerico del coeficiente de determinacion multiple 1) Asigne10s valores numericos para cualquier coeficiente de correlacion posible

12 Hursting et al (A-6) evaluaron los efectos deciertas variables demograficas sobre las concenshytraciones del fragmento de protrombina 12 (F12) en una poblacion sana Los datos obtenishydos corresponden a 357 individuos sanos En un modelo de regresion lineal multiple los logaritmos de las concentraciones de F 12 se utilizaron para efectuar una regresi6n sobre la edad raza sexo y la condici6n de tabaquismo Las variables explicativas significativas son sexo edad y habito de fumar

13 La relacion entielos parametros mecinicosy las cadenas pesadas e isoformes de miosina fueron tema de esttidio de Hewett et ai (A-7) Los investigadores estudiaron ratas con ooforectomfa y tratadas con estrogeno Encontraron que la velocidad maxima de acortamiento (Vrna) y la fuerza isometrica maxima (Pma) tenfan Una correlaci6n significativa con las cadenas pesadas e isoformes de miosina(SMI) como pOrcentaje ciel totalde especies isoformes Los investigadores utilizaron el analisis de regresion multiple con el modele en el que V

mllx es predecida a partir del conoelshy

miento del porcentaje SMI Y P en ese orden La interseccion del modele es -246 el coefishymax ciente de regresion asociado con el porcentaje SMI es 005 y el coeficiente de regresion asociado con P max es 00005 La prueba t de Student de significacion para los coeficientes de regresion produjo valores p de p lt 0002 para el porcentaje de SMI y P lt 61 para P max

14 Maier et al (A-8) condujeron un estudio para investigar las relacioms entrlt las concentracioshynes de eritropoyetina en la sangre venosa umbilical y los signos cHnicos de hipoxia fetal Los individuos eran 200 neonatos nacidos consecutivamente Utilizaron el analisisde regresion multiple para encontrar que las concentraciones de eritropoyetina ten fan correlacion signishyficativa (p lt 01) con el retardo de crecimlento fetal y la acidosis umbilical pero no con la edad gestacional elHquido amni6tico terudo con meconio un ritmo cardiacoanormal del feto 0 con lacalificaci6n de Apgar a los 5 minutos

15 En un estudio realizado por Sinha et al (A-9) se investig6 en 68 varones voluntarios que no fuman y con edades entre 30 y 59 afios la correlaci6n entre la vitamina C de La dieta y el acido ascorbico plasmatico (M) Se examinaron las mediciones de acido asc6rbico mediante el moshydelo de regresion multiple en el que se incluyeron variables como la vitamina C de la dieta calorfas peso corporal y cantidad total de bebidas consumidas Un calculo de las relaciones entre la vitamina C consumida y el acido asc6rbico plasmatico produjo r= 43 (p lt 0003)

16 Carr et al (A-I0) investigaron larelaci6n entre los lfpidos del suero la fluidez dela membrashyna la insulina y la actividad de intercambio de sodio e hidrogeno de los linfocitos human os en 83 individuos sin enfermedades actuales Como parte del analisis de regresion multiple se efectuaron pruebas de la intensidad de la relaci6n entre el fndice de eflujo maximo de protones y edad (p = 005) presion sangulnea sistolica (p = 04) anisotropia de la membrashyna (p 03) Y colesterol en el suero (p = 03)

Para cada una de los siguientes con juntos de datos dados en los ejercicios del 17 al19 haga las siguientes actividades que sean mas adecuadas a) Obtenga la ecuaci6n de regresi6n multiple por minimos cuadrados b) Calcule el coeficiente de determinacion multiple de la muestra c) Calculeel coeficiente de corre1acion multiple de La muestra d) Calcule los coefientes de determinacion y correlaci6n simple e) Calcule los coeficientes de correlacionparcial t) Elabore graficas g) Formule hip6tesis relevantes aplique las pruebas adecuadas y calcule los valores de p

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 39: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

512 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

h) Formule las decisiones estadisticas y conclusiones dinicas que los resultados de la prueba de hipotesis justifiquen

i) U dIke las ecuaciones de regresion para efectuar predkcionesy estimaciones respecto a la variable dependiente para los valores seleccionados para las variables independientes

j) Elabore los intervalos de confianza para los panimetros importantes de la poblacion

k) Describa las pobladones para las que el analisis es aplicable

17 Pellegrino et ai (Amiddot 1 1) investigaron sobre la hip6tesis de que la broncoconstriccion maxima puemiddot de ser pronosticada a partir de los efectos broncomotores de Ia inhalaci6n profunda yel grado de sensibilidad de las vias repiratorias a la metacolina (MC) EI grupo estaba formado por 26 indivimiddot duos (22 varones y 4 mujeres) sanos 0 medio asmaticos que tenian broncoconstipaci6n leve al inhalar MG La edad media de los pacientes era de 31 aiios con una desviaci6n estandar de 8 Hubo un fumador en el grupo Entre los datos recolectados sobre cada individuo estan las simiddot guientes observaciones respecto a diversas variables del funcionamiento de los pulmones

(Xu) (X) (X13

)

(X) (X) (x) (X7) (x) (x) (XIO) VEF max Vmomax VPsomax (XI) VEFtFVC (x) (X ) propor pen PDsVEF PD40 Vm 50 PD40 VPo deer deer deerVEF sVEF pred MP MP (In mg) (lnmg) (lnmg) () () ()Vmso VP50

522 10875 8392 530 390 136 075 844 824 634 2140 5540 7440 538 12396 7854 600 370 162 056 776 700 618 1580 5080 8514 362 middotllL04 8619 310 285 110 069 692 661 556 3040 5436 8307 394 9426 8528 410 270 152 044 679 852 638 1640 2910 5850 448 10443 7658 321 300 107 063 879 974 668 2780 4630 7670 528 U733 8199 565 555 102 083 898 897 819 3260 7080 9000 380 9337 7661 375 470 080 050 1052 1060 1004 1580 3530 6490 314 10467 8263 320 320 100 070 618 658 602 3760 6410 8750 526 12009 8484 630 740 089 055 1185 1185 1185 1170 2910 4120 487 12114 8969 550 550 100 056 1185 1185 1185 1030 1640 2970 535 12471 8465 560 700 080 040 1198 1198 1129 000 1800 4720 430 9598 8037 578 490 LI8 059 648 619 511 1700 4820 7960 375 8782 6579 226 165 137 053 625 702 503 2710 3953 8180 441 11221 6978 319 295 108 057 766 808 551 2470 4880 8590 466 10837 7872 500 590 085 049 779 977 610 1500 3500 7030 519 9905 7362 420 150 280 063 515 578 472 3140 6190 8670 432 12238 7513 439 330 133 074 620 634 510 2825 6030 7800 405 9597middot 8438 340 250 130 059 564 852 561 1820 2950 4600 323 8825 8730 400 400 100 071 347 343 277 2160 6450 8600 399 10556 8674 530 270 196 076 640 520 617 2250 6300 7780 437 10234 8018 320 180 177 085 505 497 542 3530 5700 7800 267 6811 6512 170 130 138 091 397 395 4U 3240 5880 8240 475 10371 7308 460 360 121 071 634 529 604 1885 4750 7220 319 8812 8507 320 180 177 076 508 485 516 3620 8340 9300 329 10217 9268 380 240 158 050 821 690 1060 2160 2810 6GG 287 9503 9567 300 300 100 075 624 599 750 2700 4670 6830

Vmso yVPso flujos espiratorios forzados maximos y parcial al50 por ciento de control de FVe proporci6n MJP relamiddot ci6n de Vmso a VPso de control pendiente MP = pendiente de la regresi6n de los decrementos porcentuales de Vmso yVPso registrados durante la prueba deinhalaci6n de Me PD1sVEFI = dosis de Me que disminuye VEF1 en 15 por ciento de control dosis de Me que disminuye Vmso yVPso en 40 por ciento de control respectivamente maximo dismishynuido disminuci6n porcentual maxima en la meseta FUENTE Utilizada con autorizaci6n del Dr Riccardo Pellegrino

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 40: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

513 PREGUNTAS Y EJERCICIOS DE REPASO

18 EI prop6sito del estudio de OBrien et al (A-12) era evaluar la funci6n del eje hipotahimicoshypituitario-adrenal (HPA) (que se sahe se altera en la depresi6n) en padentes con la enfermeshydad de Alzheimer (EA) por medio de la prueba de hormona adrenocorticotr6pica (ACTH) la cual evalua la fund6n adrenal al medir la producci6n de cortisol de la glandula adrenal en respuesta a la inyecci6n de ACTH Los individuos con la enfermedad de Alzheimer (promediaban la edad de 699 afios con una desviaci6n estandar de 98) fueron rec1utados a partir de la referenda a hospitales espedalizados en problemas de memoria Los indivishyduos normales de control eran c6nyuges de los pacientes y personas que vivian en un lugar de retiro (con edad media de 738 afios y una desviaci6n estandar de 116) Habia ocho varones y ocho mujeres en el grupo de enfermos y 10 varones y ocho mujeres en el grupo de control Entre los datos recolectados estan las siguientes observaciones sobre la edad (Cl) edad de inido de la enfermedad de Alzheimer en los individuos (C2) tiempo en meses desde el inido c1inico de la enfermedad (C3) calificaci6n del examen cognitivo (C4) nive maximo de cortisol (C5) y la respuesta total hormonal (C6)

CI

Individuos con enfermedad de Alzheimer

C2 C3 C4 C5 C6 CI C2

Grupo de control

C3 C4 C5 C6

73 87 60 62 75 63 81 66 78 72 69 76 46 77 64 72

69 83 54 57 70 60 77 64 73 64 65 73 41 75 61 69

48 48 72 60 48 24 48 24 60 72 48 36 60 18 16 30

75 39 67 64 51 79 51 61 32 61 73 63 73 63 59 47

40000 56500 30700 33500 35200 42600 41300 40200 51800 50500 42700 40900 33300 59100 55900 51100

44610 63855 31110 36000 44760 47250 51825 41745 66030 49905 55350 51960 33030 73125 60750 54945

70 81 82 57 87 88 87 70 63 87 73 87 58 85 58 67 68 62

97 93 93

101 91 88 91

100 103 81 94 91

103 93 99

100 100 93

41900 47000 41700 21500 24400 35500 39200 35400 45700 32300 38600 24400 35300 33500 47000 34600 26200 27100

53175 54285 47160 27120 23895 33565 42810 45105 48765 39360 48150 25830 42060 37425 55140 50745 28440 23595

= No se apliea FUENTE Utilizada eon autorizaci6n del Dr John T OBrien

19 Johnson et al (A-13) se dieron cuenta de que la capaddad para identificar la fuente de inshyformaci6n recordada es una fund6n cognitiva fundamental Condujeron un experimento para explorar la contribuci6n relativa de indicaciones preceptuales e informaci6n de operashydones cognitivas a las deficiencias relacionadas con la edad en la discriminaci6n de recuershydos de diferentes fuentes externas (monitoreo de fuente externa) Los individuos para el experimento eran 96 estudiantes universitarios y de preparatoria (41 varones y 55 mujeres) con edades entre 18 y 27 anos Entre los datos que recolectaron los investigadores estan las siguientes calificaciones de desempeno de reconocimiento seglin las condiciones de monitoshy

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 41: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

514 CAPITULO 10 REGRESION Y CORRELACION MULTIPLE

reo de la fuente (CI C2 C3) Y las calificaciones segtin la Prueba de reconocimiento facial de Benton (C4) la Escala revisada de inteligencia de adultos de Wechsler (ERIAW) la subescala del Diseno por bloques (C5) la subescala de vocabulario de ERIAW (C6) la Prueba de fluimiddot dez verbal de Benton (C7) y la Prueba de ordenamiento de cartas de Wisconsin (C8)

Cl C2 C3 C4 C5 C6 C7 C8

0783 263 0808 25 38 62 67 6 0909 336 0846 50 0920 214 0616 23 25 53 47 6 0727 336 0846 25 40 49 58 6 0737 293 0731 59 0600 407 0962 19 50 51 35 6 0840 315 0885 57 0850 306 0769 55 0875 372 0923 24 23 52 35 6 0792 315 0884 50 0680 407 0962 56 0731 464 1000 23 30 59 47 3 0826 184 0616 52 0609 298 0846 56 0923 464 1000 53 0773 336 0846 60 0714 162 0577 23 43 53 42 6 0667 372 0923 20 32 59 28 6 0769 140 0423 51 0565 355 0885 45 0824 178 0577 45 0458 190 0615 21 46 50 47 6 0840 407 0962 59 0720 407 0962 53 0917 372 0923 24 31 43 37 6 0560 407 0926 62 0840 407 0962 26 22 50 40 6 0720 407 0962 52 0783 174 0577 54 0696 162 0539 57 0625 372 0923 22 37 55 40 6 0737 112 0423 47 0900 192 0654 22 40 46 42 6 0565 355 0885 22 43 56 64 6 0680 407 0962 54 0760 407 0962 58 0958 190 0615 24 36 46 43 6 0652 298 0846 54 0560 407 0962 56

(Continua)

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 42: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

515 PREGUNTAS Y EJERCICIOS DE REPASO

CI C2 C3 C4 C5 C6 C7 C8

0500 192 0654 24 42 45 46 6 0826 263 0808 60 0783 258 0808 60 0783 263 0808 49 0750 214 0692 22 37 62 58 6 0913 211 0693 46 0952 149 0539 26 32 48 36 6 0800 407 0962 59 0870 355 0885 48 0652 197 0654 59 0640 407 0962 25 36 56 54 6 0692 464 1000 23 23 58 25 6 0917 372 0923 55 0760 407 0962 22 35 52 33 6 0739 355 0885 24 43 58 43 6 0857 320 0808 59 0727 336 0846 61 0833 280 0846 56 0840 407 0962 21 11 49 58 3 0478 227 0731 60 0920 407 0962 24 40 64 50 6 0731 464 1000 20 40 51 50 6 0920 407 0962 23 50 61 53 6 0720 407 0962 57 1000 279 0807 25 47 56 30 6 0708 372 0923 24 16 57 42 6 1000 464 1000 25 48 55 54 6 0739 355 0885 23 27 57 38 6 0600 420 0962 22 38 57 33 6 0962 464 1000 25 37 63 31 6 0772 222 0731 24 48 51 41 6 0800 292 0847 24 28 47 45 6 0923 464 1000 25 45 54 48 6 0870 350 0885 24 44 54 48 5 0808 464 1000 24 43 57 58 6 1000 407 0962 25 30 59 49 6 0870 355 0885 26 44 61 35 6 0923 464 1000 52 0958 258 0808 27 32 52 33 6 0826 350 0885 21 31 61 44 6 0962 372 0923 23 31 57 38 6 0783 350 0885 23 46 60 36 6

(Continua)

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 43: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

516 CAPiTULO 10 REGRESION Y CORRELACION MULTIPLE

Cl C2 C3 C4 C5 C6 C7 C8

0905 320 0808 23 34 55 37 4 1000 464 1000 23 33 57 33 6 0875 372 0923 21 34 55 29 6 0885 407 0962 52 0913 292 0846 23 44 57 47 6 0962 407 0961 24 36 54 43 6 0682 336 0846 20 41 61 34 1 0810 263 0769 20 40 57 43 6 0720 279 0808 25 23 64 43 3 0875 280 0846 24 43 59 43 2 0923 372 0924 25 40 58 33 6 0909 336 0846 24 43 56 41 6 0920 407 0962 24 50 52 28 6 1000 372 0923 21 45 64 46 6 0609 350 0885 22 25 49 35 6

= Dato faltante FUENTE Utilizada con autorizaci6n de la Dra Doreen M De Leonardis

En los siguientes ejercicios se utiliza una gran cantidad de datos disponibles en disco para computadora que el editor puede proveer

1 Consulte los datos sobre 500 pacientes que han buscado tratamiento para aliviar los sfntoshymas de enfermedad respiratoria (ENFRESP) Un equipo de investigadores medicos condushyjeron un estudio para determinar que factores pueden estar relacionados con las enfermedades respiratorias La variable dependiente Yes la medida de gravedad de la enfermedad Un valor mayor indica que la condicion es mas grave Las variables independientes son las 8ishyguientes

Xl educacion (grado maximo terminado) X

2 = cantidad de personas que viven en un mismo cuarto

X3 = medicion de la calidad del aire en ellugar de residencia (un niimero mas grande indica calidad menor) X

4 = estado nutricional (un numero mayor indica un mejor nivel de nutricion)

X5 = condicion de tabaquismo (0 = sf fuma I no fuma)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y realice un analisis estadfstico que pueda ser de utilidad para los investigadores Prepare un informe narrativo de los resultados y conclusiones Utilice ilustraciones graficas donde sea adecuado Compare los resultados con los resultados generados por otros estudiantes Consulte al insshytructor respecto al tamafio de la muestra que debe seleccionarse

2 Tome como referencia los datos de los factores de riesgo cardiovascular (FACTRIESGO) Los individuos son 1000 varones que realizan actividades sedentarias Se pretende estudiar las relaciones entre los factores de riesgo en esa poblacion Las variables son

Y == consumo de oxfgeno XI presion sangufnea sist6lica (mm Hg)

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 44: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

BIBLIOGRAFIA 517

X2 colesterol total (mgdl)

Xg = colesterol HDL (mgdl)

X4 = trigliceridos (mgdl)

Seleccione una muestra aleatoria simple de individuos a partir de la poblacion y efecrue un analisis estadfstico adecuado Prepare un informe narrativo de los hallazgos y comparelos contra los resultados de otros estudiantes Consulte al instructor respecto al tamafio de la muestra que debe seleccionarse

BmUOGRAFIA

Bibliografia de metodologfa

1 George VI Snedecor y William G Cochran Statistical Methods sexta edicion The Iowa State University Press Ames

2 Robert G D Steel y James H Torrie Principles and Procedures ofStatistics McGraw-Hill New York

3 R L Anderson y T A Bancroft Statistical Theory in Research McGraw-Hill New York

Bibliografia de aplicaciones

Amiddot1 Werner Kalow y Bing-Kou Tang Caffeine as a Metabolic Probe Exploration ofthe EnzymeshyInducing Effect of Cigarette Smoking Clinical Pharmacology amp Therapeutics 49 44-48

Amiddot2 James F Malec Jeffrey S Smigielski y Robert VI DePompolo Goal Attainment Scaling and Outcome Measurement in Postacute Brain Injury Rehabilitation Archives ofPhysical Medicishyne and Rehabilitation 72 138-143

Amiddot3 Sandra K David y William T Riley The Relationship of the Allen Cognitive Level Test to Cognitive Abilities and Psychopathology Americanjournal ofOccupational Therapy 44 493shy497

Amiddot4 Neal L Benowitz PeytonJ acob III Charles Denaro y Roger Jenkins Stable Isotope Studies of Nicotine Kinetics and Bioavailability Clinical Pharmacology amp Therapeutics 49 270-277

Amiddot5 David M Steinhorn y Thomas P Green Severity of Iliness Correlates with Alterations in Energy Metabolism in the Pediatric Intensive Care Unit Critical Care Medicine 19 1503shy1509

Amiddot6 M J Hursting A G Stead F V Crout B Z Horvath y B M Moore Effects ofAge Race Sex and Smoking on Prothrombin Fragment 12 in a Healthy Population Clinical Chemistry 39 683-686

Amiddot7 T E Hewett A F Martin y R J Paul Correlations Between Myosin Heavy Chain Isoforms and Mechanical Parameters in Rat Myometriumjournal ofPhysiology (Cambridge) 460 351shy364

AmiddotS R F Maier K Bohme J VI Dudenhausen y M Obladen Cord Erythropoietin in Relation to Different Markers of Fetal Hypoxia Obstetrics and Gynecology 81575-580

Amiddot9 R Sinha G Block YP R Taylor Determinants of Plasma Ascorbic Acid in a Healthy Male Population Cancer Epidemiology Biomarkers and Prevention 1297-302

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517

Page 45: Daniels Capítulo 10 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

513 cAPiTULO 10 REGRESIONY CORRELACIONMULTIPLE

AmiddotI0 P Carr N A Taub G F Watts y L Poston Human Lymphocyte Sodium-Hidrogen Exchange The Influences of Lipids Membrane Fluidity and Insulin Hypertension 21 344-352

AmiddotII Riccardo Pellegrino Benedetto Violante y Vito Brusasco Maximal Bronchoconstriction in Humans Relationship to Deep Inhalation and Airway Sensitivity American Journal of Respiratory and Critical Care Medicine 153 115-121

Amiddot12 J T OBrien D Ames I Schweitzer M Mastwyk y P Colman Enhanced Adrenal Sensitivity to Adrenocorticotrophic Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimers Disease Psychological Medicine 267-14

Amiddot13 Marcial K Johnson Doreen ~ De Leonardis Shahin Harshtroudi y Susan A Ferguson Aging and Single Multiple Cues in Source Monitoring Psychology and Aging 10 507-517