Grupo 494 Momento3

42
1 Trabajo colaborativo Momento 3 Unidad 3 - Regresión y Determinación REGRESION LINEAL SIMPLE REGRESION LINEAL MULTIPLE Leymar Andrés Ardila Carlos Andrés Sandoval John Fernando Ballén - Código: 80755773 Grupo 494 Tutor: Jean-Pierre Lara Arbeláez UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD BOGOTA D.C.

description

trabajo colaborativo 3 de estadistica descriptiva

Transcript of Grupo 494 Momento3

34

Trabajo colaborativo Momento 3

Unidad 3 - Regresin y Determinacin REGRESION LINEAL SIMPLEREGRESION LINEAL MULTIPLE

Leymar Andrs ArdilaCarlos Andrs SandovalJohn Fernando Balln - Cdigo: 80755773Grupo 494

Tutor: Jean-Pierre Lara Arbelez

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNADBOGOTA D.C.10-05-2015

TABLA DE CONTENIDO

TEMAPGINAINTRODUCCION.. 3JUSTIFICACION4OBJETIVOS5

APORTES LABORATORIO.....6

Aporte laboratorio Leymar Ardila.....6Aporte laboratorio John Balln....11

APORTES INDIVIDUALES

Aporte laboratorio Carlos Sandoval18Aporte laboratorio Leymar Ardila....24Aporte laboratorio John Balln....29

APORTES GRUPALES....32

PROPUESTA UNICA35

SUGERENCIAS.36

INTRODUCCIN

El presente trabajo se da con base al estudio de la tercera unidad, correspondiente a regresin y determinacin. En el transcurso del trabajo y correspondiendo a las actividades individuales se da el trabajo realizado por cada uno de los participantes del grupo respecto a identificacin de variables cuantitativas, la realizacin de diagramas de dispersin, los modelos matemticos que permiten los clculos y la determinacin del porcentaje de explicacin del modelo y el grado de relacin de las variables. Cada uno de estos puntos solicitados en la actividad, tienen un soporte escrito y otro soporte en tabla de Excel, con el fin de dar un informe claro respecto a los resultados de los puntos solicitados.

Esto claro, sin perder el enfoque principal consistente en la solucin que requiere el hospital Federico Lleras Acosta para mejorar sus ndices de servicio y la atencin prestada a sus pacientes. Esto conlleva a que las evidencias adjuntas en el presente documentos sean pensadas justamente en esta situacin.

La presentacin dada por cada uno de los estudiantes se dar por secciones para dejar la aclaracin del aporte de cada quien, a su vez que tambin tendr una seccin del trabajo que se realiz grupalmente con la aclaracin del principal autor.

Adicionalmente se adjuntan los informes y el soporte de las tablas de datos en Excel para su respectiva validacin o de quien lo requiera.

Por ltimo se deja la aclaracin que se realiza la propuesta nica de acuerdo a la nica propuesta encontrada en el foro de trabajo colaborativo.

JUSTIFICACIN

El presente trabajo tiene como finalidad presentar las evidencias de los aprendizajes obtenidos en la unidad 3 del curso de Estadstica Descriptiva. Adicionalmente Muestra por medio de dichas evidencias el proceso dado por cada uno de los integrantes del grupo, a su vez que el propsito de adquirir conocimiento con base a la participacin en el foro del curso y el conocimiento compartido respecto a los aportes realizados.

OBJETIVOS

Determinar la relacin entre dos variables cuantitativas del problema de estudio. Realizar e interpretar acertadamente los diagramas de dispersin. Calcular la recta de regresin y el coeficiente de correlacin entre una variable dependiente y varias variables, si es el caso. Realizar el diagrama de dispersin por las variables escogidas por cada uno de los participantes. Calcular la recta de regresin y el coeficiente de correlacin para probar estadsticamente su relacin.

APORTES LABORATORIOS

Laboratorio - Leymar Andrs Ardila

1.Se quiere estudiar la asociacin entre consumo de sal y tensin arterial. A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensin arterial un tiempo despus.

X (sal) Y (Presin) 1,8 100 2,2 98 3,5 105 4,0 110 4,3 112 5,0 120

Variable X: gr. de sal diarios (no aleatoria)Variable Y: presin arterial en mm. de Hg

a) Realice el diagrama de dispersin y calcule el coeficiente de correlacin e interprete

b. encuentre el modelo matemtico que permite predecir el efecto de una variable sobre otra. Es confiable?RTA: se utiliza el mtodo de la regresin lineal simple

c. determine el porcentaje de explicacin del modelo y el grado de relacin de las dos variables

Se halla a a y b

Medidas de cada conjunto de datos:

La ecuacin de la recta, esta dada por:

Error estndar de la recta

Se halla el coeficiente de determinacin y el coeficiente de correlacion:

El grado de relacin de las variables es de: 0,97

d. si a un paciente se le suministra una dosis de sal de 6,5 Cul es la tensin arterial esperada?Utilizamos la ecuacin de la recta asi:=(6,31)(6,5)+85,6= 126,615

2. En un nuevo proceso artesanal de fabricacin de cierto artculo que est implantado, se ha considerado que era importante ir anotando peridicamente el tiempo medio (medido en minutos) que se utiliza para realizar una pieza y el nmero de das desde que empez dicho proceso de fabricacin. Con ello, se pretende analizar como los operarios van adaptndose al nuevo proceso mejorando paulatinamente su proceso de produccin.Los siguientes datos representan dicha situacin:

X10203040506070

Y35282320181513

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las variables

El tipo de asociacin al diagrama es dispersin lineal descendente

b. Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre la otra. Es confiable?

Y= a+bXY= 0.3464x+35.571R=0.9454

La ecuacin de la recta es confiable porque el coeficiente de la determinacin (R) est cercano a 1 y tiene una correlacin excelente

c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos variables.

El R afirma que el modelo explica el 94.5% de la informacin. El valor de r confirma el grado de relacin entre las variables: el tiempo empleado en la fabricacin del articulo est directamente relacionado en un 97% con los das empleados

d. Qu tiempo deber tardarse un empleado cuando se lleven 100 das?

Y= -0.3464 (100)+35.571= -34.64+35.571= 0.931Cuando un empleado lleve 100 das deber tardarse 0.931 min

3. Una Nutricionista de un hogar infantil desea encontrar un modelo matemtico que permita determinar la relacin entre el peso y la estatura de sus estudiantes. Para ello selecciona 10 nios y realiza las mediciones respectivas.A continuacin se presentan los resultados:

Estatura (cm)121123108118111109114103110115

Peso ( kg)25221924191820152021

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las variables

b. Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre la otra. Es confiable?

Y= a+bXY= 0.4212X 27.377R= 0.8102Se puede asegurar que la ecuacin de la recta no es muy confiable porque el coeficiente de determinacin se aleja un poco de 1 y tiene un grado de confiabilidad aceptable

c. Determine el grado de relacin de las dos variables.

El valor de r confirma el grado de relacin entre las variables: peso y estatura de los estudiantes esta directamente relacionado

d. Cul es el peso que debera tener un estudiante que mida 130 cm?

X=1132/10= 113cmY= 203/10= 20.3Kg130cm*20.3Kg= 2639/113Kg= 23.3Kg

R= el peso de un estudiante que mida 130cm debe de ser de 23.3Kg

Laboratorio John Fernando Balln

X(SAL)Y(PRESION)X^2Y^2XY

1,81003,2410000180

2,2984,849604215,6

3,510512,2511025367,5

41101612100440

4,311218,4912544481,6

51202514400600

3,5107,513,3011612,17380,78

Modelos matemticos:METODO REGRECION LINEAL SIMPLEDiferencia respecto al mtodo de los mnimos cuadrados:

Ecuacin del Error estndar de estimacin:

El es confiable, indicando un grado de relacin entre variables de 97%. Los procedimientos matemticos para llegar a dicha conclusin se encuentran en el Excel anexo, en la pestaa Sal_tension.

El grado de relacin es de 0,97%. Los procedimientos y formulas se encuentran en el Excel anexo.

Dada la ecuacin:

De acuerdo a los valores dados, se genera diagrama de dispersin de acuerdo a la tabla:

T. mins (X)No dias (Y)X^2Y^2XY

10351001225350

2028400784560

3023900529690

40201600400800

50182500324900

60153600225900

70134900169910

Medias40222000522730

Modelos matemticos

La explicacin matemtica de los resultados se encuentra en el Excel anexo en la pestaa Proceso Artesanal.a-0,34643

b35,57

R = 0,9454Tiene un relativo grado de confiabilidad, teniendo en cuenta

El grado de relacin es de 0,94%. Al estar el coeficiente de determinacin cercano a 1 es confiable, adicional tiene una buena correlacin. Los procedimientos y formulas se encuentran en el Excel anexo.

c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos variables.

El modelo explica el 94% de la informacin, de acuedo a anlisis de R2. La duracin del tiempo de fabricacin de la artesana es directamente proporcional a los das empelados.

(Clculo realizado en el Excel anexo. Pestaa Proceso Artesanal)

Estatura cm (X)Peso Kg (Y)X^2Y^2XY

12125146416253025

12322151294842706

10819116643612052

11824139245762832

11119123213612109

10918118813241962

11420129964002280

10315106092251545

11020121004002200

11521132254412415

Sumatorias1132203128490419723126

a0,4212

b-27,377

R20,810

(Nota: Detalle de operaciones y formulas en el Excel anexo, pestaa Estatura_peso)La ecuacin de la recta no es muy confiable, al estar el coeficiente de determinacin alejado del 1. El grado de confiabilidad es aceptable.

Peso y estatura estn directamente relacionados. La conclusin se da respecto al valor de r.

De acuerdo a las medias se realiza la operacin: )/113,2=23,3kg(Desarrollo de ejercicio en Excel anexo)MediasX cmY kgEstaturaPeso

113,220,313023,KG

APORTES INDIVIDUALES

Aportes individuales Carlos Andrs Sandoval

REGRESION Y CORRELACION SIMPLE

Identificar dos variables cuantitativas de la situacin estudiada que puedan estar relacionadas. Las variables identificadas en este punto fueron PESO segn la.

realizar el diagrama de dispersin de dichas variables y determinar el tipo de asociacin entre las variables.Los datos que tenemos para estas dos variables tenemos los siguientes datos:N pacientesx (edad)Y (peso)xyxy

102,6006,76

203,1009,61

303,1009,61

403,40011,56

503,90015,21

615,25,2127,04

719,49,4188,36

819,79,7194,09

928,917,8479,21

10211,923,84141,61

11312,537,59156,25

12314,242,69201,64

13315,345,99234,09

14416,56616272,25

15416,766,816278,89

16515,979,525252,81

17516,984,525285,61

18518,391,525334,89

19524,5122,525600,25

2072316149529

21819,7157,664388,09

221330,5396,5169930,25

2316457202562025

241645,9734,42562106,81

251754,9933,32893014,01

261755,2938,42893047,04

271758,6996,22893433,96

281764,31093,12894134,49

291853,8968,43242894,44

301960,81155,23613696,64

311964,31221,73614134,49

321965,21238,83614251,04

331967,91290,13614610,41

341978,51491,53616162,25

352052,710544002777,29

362060,512104003660,25

372065,613124004303,36

38216012604413600

392163,81339,84414070,44

402165,41373,44414277,16

41225411884842916

422267,91493,84844610,41

432352,61209,85292766,76

442352,91216,75292798,41

452356,81306,45293226,24

462360,21384,65293624,04

47236514955294225

482367,21545,65294515,84

492370,81628,45295012,64

50245613445763136

512456,91365,65763237,61

522458,21396,85763387,24

532461,61478,45763794,56

542468,91653,65764747,21

552558,91472,56253469,21

562560,815206253696,64

572580,92022,56256544,81

582657,31489,86763283,29

592663,21643,26763994,24

60267018206764900

612675,31957,86765670,09

62316018609613600

63317222329615184

643372,92405,710895314,41

653373,82435,410895446,44

663460204011563600

673472,92478,611565314,41

683578,92761,512256225,21

693672,92624,412965314,41

703767,22486,413694515,84

713785,83174,613697361,64

723978,53061,515216162,25

733979,53100,515216320,25

743985,93350,115217378,81

754057,9231616003352,41

764078,4313616006146,56

774245,81923,617642097,64

784385365518497225

794478,5345419366162,25

804485374019367225

814555247520253025

824758,22735,422093387,24

834858,82822,423043457,44

844887,24185,623047603,84

854965,93229,124014342,81

865062,3311525003881,29

875185433526017225

885187,54462,526017656,25

895245,82381,627042097,64

905265,73416,427044316,49

915378,64165,828096177,96

925460,33256,229163636,09

935460,63272,429163672,36

945467,23628,829164515,84

955485,84633,229167361,64

965565,8361930254329,64

975578,14295,530256099,61

985578,6432330256177,96

995667,23763,231364515,84

1005760,53448,532493660,25

1015878,64558,833646177,96

1025962,93711,134813956,41

1035965,73876,334814316,49

1046067,5405036004556,25

1056158,33556,337213398,89

1066272,5449538445256,25

1076458371240963364

1086557,6374442253317,76

1096857,83930,446243340,84

1106878530446246084

1117162,74451,750413931,29

1127345,23299,653292043,04

1137370511053294900

1147555,94192,556253124,81

1157560,8456056253696,64

1168165,25281,265614251,04

1178270574067244900

1188550,2426772252520,04

1198762,95472,375693956,41

1209470,26598,888364928,04

sumatoria40836718267090,5203031437809,28

El diagrama de dispersin para estas variables ser:

El objetivo del anlisis de regresin lineal es predecir los valores de la variable respuesta, en funcin de los valores de la variable independiente:Regresin simple es cuando solo hay una variable independiente y el modelo a ajustar es el siguiente:

Donde Y es la variable respuesta, X es la variable independiente, constante es la variacin en funcin de la variable independiente y es una constante.Ahora empezamos a hallar valores para con la siguiente formula:

Remplazamos valores en formula:

Operamos:

Operamos:

Ahora empezamos a hallar valores para con la siguiente formula:

Remplazamos valores en formula:

Operamos:

Ahora remplazamos en el modelo matemtico que nos ayudara a solucionar la variable respuesta:

Remplazamos valores:

Remplazamos valores de edad de mayor a menor:

Remplazamos valores de edad de mayor a menor:

Ahora hallaremos el porcentaje de explicacin del modelo y el grado de relacin de las dos variables con el coeficiente de correlacin de Pearson ( r )

Aportes Individuales Leymar Andrs Ardila

Regresin y Correlacin lineal Simple-Identificar dos variables cuantitativas de la situacin estudiada que puedan estar relacionadas.

Cuadro estadstico ac se recopila la informacin de determinada variable y se hace un anlisis probabilstico

En el anlisis probabilstico se muestra el promedio de visitas por edades donde X= edadesf 1= N visitas del ltimo trimestren= total de visitas

xf1F1h1H1

0550,031250,03125

16110,03750,06875

22130,01250,08125

36190,03750,11875

42210,01250,13125

54250,0250,15625

71260,006250,1625

81270,006250,16875

131280,006250,175

162300,01250,1875

174340,0250,2125

181350,006250,21875

198430,050,26875

205480,031250,3

214520,0250,325

223550,018750,34375

238630,050,39375

249720,056250,45

255770,031250,48125

266830,03750,51875

312850,01250,53125

332870,01250,54375

344910,0250,56875

351920,006250,575

361930,006250,58125

372950,01250,59375

3951000,031250,625

4031030,018750,64375

4231060,018750,6625

4311070,006250,66875

4421090,01250,68125

4511100,006250,6875

4721120,01250,7

4821140,01250,7125

4911150,006250,71875

5011160,006250,725

5131190,018750,74375

5231220,018750,7625

5311230,006250,76875

5441270,0250,79375

5531300,018750,8125

5621320,01250,825

5721340,01250,8375

5811350,006250,84375

5941390,0250,86875

6011400,006250,875

6221420,01250,8875

6411430,006250,89375

6521450,01250,90625

6821470,01250,91875

7111480,006250,925

7321500,01250,9375

7521520,01250,95

8121540,01250,9625

8211550,006250,96875

8521570,01250,98125

8721590,01250,99375

9411600,006251

TOTAL n=1601

- Realizar el diagrama de dispersin de dichas variables y determinar el tipo de asociacin entre las variables

Diagrama de dispersin y correlacin lineal

Aportes individuales John Fernando Balln

-Identificar dos variables cuantitativas de la situacin estudiada que puedan estar relacionadas.Se escogen como variables cuantitativas la edad y las visitas realizadas el ltimo trimestre. Saber de qu edad son las personas que ms frecuentan el hospital podra ser un dato para apoyar la mejora del servicio.- Realizar el diagrama de dispersin de dichas variables y determinar el tipo de asociacin entre las variables. Diagrama de dispersin, correlacin lineal.

- Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre la otra. Es confiable?Se procede por lo tanto a determinar la ecuacin de la recta que ms se ajusta, por el mtodo de mnimos cuadrados. Se tiene en resumen las siguientes tablas.

ElementosSumatoriasCuadrados

X408316670889

Y16226244

X^2203031

Y^2262

XY5548

n(X)120

Ya se tienen los valores, por lo que se pasa a trabajar en la ecuacin de la recta ajustada est dada por:

Se procede por mtodo de mnimos cuadrados:

Por lo tanto:

Y es confiable?... De acuerdo a , este acerca mucho mas a 0 que a 1, por lo que el grado de confiabilidad es muy bajo y se recomienda no utilizar el modelo de regresin estimado.- Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos variables.El afirma adems que el modelo explica un 0,050% de la informacin. El valor queda en 2,23% lo que indica un mnimo porcentaje de grado de relacin entre las variables. (Nota: Las frmulas matemticas para el desarrollo de los resultados se encuentran en el archivo de Excel adjunto)

Conclusin: El nmero de visitas indica que la muestra de poblacin con edad promedio que ms consultas realizo en el trimestre esta entre los 22 y 26 aos. Esto aunque no indica nada definitivo, podra ser determinante para que sean atendidos por aporte de los menores de edad y adultos mayores, recibiendo un servicio ms express. No es que se les dejara de atender como es debido, es solo que los casos ms graves y que requieren de ms tiempo para el primer diagnstico, se trataran como un flujo a parte para mejorar la atencin. Adicionalmente y teniendo en cuenta que son mayora, mejorar el servicio en tiempo le dara un plus de utilidad a estos usuarios por lo que aumentara los indicadores de servicio. Tambin se debe hacer el reporte con las EPS, al ser gente joven es probable que den buena acogida al sistema virtual para asignacin de citas. Esto conllevara a una reduccin de tiempo en tramitologa y a evitar que el hospital colapse en servicio por que las personas van en primera instancia al hospital por urgencias, si quiera por una gripa.

APORTES GRUPALES

Identificar una variable cuantitativa dependiente y varias variables independientes del estudio de investigacin.Se encuentra que las variables de la base dada son independientes. Sin embargo, una variable es dependiente de otra cuando existe una relacin de dependencia respecto a lo que se est comparando o la magnitud que se quiere hallar. Se escoge por lo tanto a la variable Hora (X) como independiente, y la variable resultante Demanda/Hora como dependiente. La idea es poder tener claridad respecto a las horas picos de atencin en el hospital.

- Realizar el diagrama de dispersin de dichas variables.Cuadro de clculo para mnimos cuadrados

Formato Hora (X)Valor (X)Demanda / Hora (Y)X^2Y^2XY

1:00:00 a. m.0,04166666730,0017361190,125

2:00:00 a. m.0,08333333340,00694444160,333333333

3:00:00 a. m.0,12510,01562510,125

4:00:00 a. m.0,16666666700,0277777800

5:00:00 a. m.0,20833333320,0434027840,416666667

6:00:00 a. m.0,2510,062510,25

7:00:00 a. m.0,29166666770,08506944492,041666667

8:00:00 a. m.0,33333333380,11111111642,666666667

9:00:00 a. m.0,37570,140625492,625

10:00:00 a. m.0,416666667110,173611111214,583333333

11:00:00 a. m.0,45833333390,21006944814,125

12:00:00 p. m.0,510,2510,5

1:00:00 p. m.0,54166666780,29340278644,333333333

2:00:00 p. m.0,58333333360,34027778363,5

3:00:00 p. m.0,625100,3906251006,25

4:00:00 p. m.0,66666666740,44444444162,666666667

5:00:00 p. m.0,70833333370,50173611494,958333333

6:00:00 p. m.0,7530,562592,25

7:00:00 p. m.0,79166666770,62673611495,541666667

8:00:00 p. m.0,83333333340,69444444163,333333333

9:00:00 p. m.0,87540,765625163,5

10:00:00 p. m.0,91666666730,8402777892,75

11:00:00 p. m.0,95833333360,91840278365,75

12:00:00 a. m.141164

Diagrama de dispersin

- calcular la recta de regresin y el coeficiente de correlacin para probar estadsticamente su relacin.

Recta de regresin de Y/X

Coincide con la de mnimosRecta de regresin:R= 0,0402

(Nota: Las frmulas de ecuacin para los valores mostrados se encuentran en el Excel adjunto, Pestaa Colabora_Disp)

PROPUESTA UNICA

La mayora de pacientes que acuden a las citas de acuerdo al diagrama de dispersin, tiende a acudir entre la 1pm y las 5pm, habiendo para esto un pico de asistencia hacia las 7pm. Tras esta validacin de datos, se propone reforzar personal en los triages de urgencia en esa franja horaria (1 de la tarde a 5 de la tarde), con el fin de mejorar y agilizar ms el servicio. Sin embargo se propondra que se realizara inicialmente a modo de pruebas piloto, donde se haga monitoreo constante de la cantidad de personal necesario para atender en estas horas y adems realizando un seguimiento propiamente a los usuarios del servicio de saludo.

Por otra parte la recta de regresin es de un 0,0402, considerndose como una correlacin positiva dbil. Esto quiere decir que las estimaciones no son muy confiables. Sin embargo si se puede notar a simple vista que estos son los horarios con mayor afectacin y que en efecto esta podra ser una medida a tomar en pos de la mejora del servicio.

Se relaciona a continuacin los link donde podrn encontrar los archivos de informe:https://www.dropbox.com/sh/aiucsujjgoh0uc9/AAADl4NCQIN3A67O2yg0hikAa?dl=0

SUGERENCIAS

Pese a que hubieron participaciones factibles en el grupo de trabajo colaborativo, hizo falta aprovechar el espacio dado por el curso para participacin grupal y aprovechar la atencin dada por el tutor por Skype por parte de los integrantes del grupo. No se vieron propuestas de solucin, se escogi la nica que estaba disponible y la cual es de la autora de John Balln.