Proyecto Estadistic

29
Universidad Simón Bolívar Procesos de fabricación I Prof. Mayra Rodríguez. PROYECTO 2 Integrantes: Ramón Márquez 11-10682 Gabriela De Jesús 11-10252 Arianna Llanos 11-10530

description

Estudio de analisis de varianza para datos muestreados.

Transcript of Proyecto Estadistic

Universidad Simn BolvarProcesos de fabricacin IProf. Mayra Rodrguez.

PROYECTO 2

Integrantes:Ramn Mrquez 11-10682Gabriela De Jess 11-10252Arianna Llanos 11-10530

Sartenejas, 21 de noviembre de 2014

INTRODUCCIONEste proyecto est comprendido por tres partes. En la primera se tiene como objetivo principal determinar si la temporada del ao incide en la formacin de diversos tipos de algas, siendo algunas bastante perjudiciales. Para esto se tienen unas muestras de agua que fueron tomadas en un ro a lo largo de las distintas temporadas en el ao, teniendo como variables la velocidad y tamao del mismo, as como tambin los distintos tipos de algas.En la segunda parte se continua con la muestra anterior, pero ahora el objetivo principal es estudia cmo y en que magnitud afectan la velocidad y el tamao del ro en la aparicin de los distintos tipos de algas.Finalmente, en la tercera parte, se busca ajustar un modelo de regresin mltiple de una muestra de precios de distintas viviendas en una localidad especfica, el cual debe relacionar dichos precios con cada una de las variables dadas. Buscando as la mejor combinacin de variables que sean suficientes para describir el precio de las viviendas.

Pregunta 1

a) Realice un breve anlisis descriptivo de los datos de inters (tome en Consideracin la temporada del ao, la velocidad y el tamao del ro).(1pts.)

Para las Variables Cuantitativas se tiene:Datos EstadsticosMxPhMnO2C1NO3NH4oPO4PO4Chlan.a1.n.a2.n..a3.n.a4.n.a5n.a6n.a7.

Min71,50,80,055,81,252,50,2-33,3-23,2-15,7-14,6-18,3-29,9-16,1

1er Cuartil7,87,711,91,449,418,650,32,1-0,7-0,6-0,7-0,60,6-1,6-1,1

Mediana8,19,835,12,8115,746,3115,65,511,57,24,91,55,014,51,97

Media8,19,144,93,4537,778,3146,613,112,66,64,31,75,75,91,98

3er Cuartil8,410,758,54,5235,3102,8220,318,325,113,88,63,510,312,14,8

Maximo9,513,4391,245,724064564,6771,6110,584,834,522,817,629,547,216,7

Varianza0,4722,4147,13,8752031,692,62129,1120,2622,3710,9117,164,537,7212,45,35

Para las Variables Cualitativas se tiene:-Temporada Del ao (season):seasonOtooPrimaveraVeranoInvierno

Frecuencia36484357

-Tamao Del rio (size):sizeLargoMedianoPequeo

Frecuencia428359

-Velocidad del Rio (speed):speedAltaBajaMediana

Frecuencia763177

b) Realice una comparacin de varianzas para las temporadas de las algas n.a6.n y n.a2.n, por medio de pruebas de hiptesis. (Use un nivel de confianza de 99%. Obtenga el estadstico y p-valor)(1pts.)Usamos el comando var.test para comparar las varianzas entre cada conjunto de algas de tipo n.a6 y n.a2 para las diferentes pocas del ao. De este obtenemos el p-valor, el estadstico, y el intervalo de confianza para un 99% de confiabilidad.

Verano:

p-valor=0.5534 F=1.2021 Intervalo: [0.5346258 ; 2.7030874]

En nuestra hiptesis nula asumimos que las varianzas de n.a6. y n.a2, y como alternativa que son diferentes.Ho: var(ver6)=var(ver2.)Ha: var(ver6.)var(ver2.) = 0.01 /2 =0.005n=43Usando una tabla para la distribucin Fisher se obtiene F/2;42;422,30Regin de Rechazo { F> F/2;42;42} 1.2021>2,30 Falso. Los datos muestran evidencia para afirmar que las varianzas poblacionales no son distintas. Ya que entramos en la regin de aceptacin para nuestra hiptesis nula.Invierno: p-valor=0.1236 F=1.5141 Intervalo: [0.753093 ; 3.0440418]

Ho: var(inv6)=var(inv2.)Ha: var(inv6.)var(inv2.) = 0.01 /2 =0.005n=57Usando una tabla para la distribucin Fisher se obtiene F/2;56;561,96 Regin de Rechazo { F> F/2;56;56} 1.5141>1,96 Falso. Los datos muestran evidencia para afirmar que las varianzas poblacionales no son distintas. Ya que entramos en la regin de aceptacin para nuestra hiptesis nula.Otoo: p-valor= 0.3634 F= 1.3635, Intervalo: [0.5593607 ; 3.3238570]

Ho: var(oto6)=var(oto2.)Ha: var(oto6.)var(oto2.) = 0.01 /2 =0.005n=36Usando una tabla para la distribucin Fisher se obtiene F/2;35;352,30Regin de Rechazo { F> F/2;35;35} 1.5141>2,30 Falso. Los datos muestran evidencia para afirmar que las varianzas poblacionales no son distintas. Ya que entramos en la regin de aceptacin para nuestra hiptesis nula.Primavera: p-valor= 0.6159 F= 1.1586 Intervalo: [0.5394417 ; 2.4883363]

Ho: var(pri6)=var(pri2.)Ha: var(pri6.)var(pri2.) = 0.01 /2 =0.005n=48Usando una tabla para la distribucin Fisher se obtiene F/2;47;471,96Regin de Rechazo { F> F/2;47;47} 1.1586>1,96 Falso. Los datos muestran evidencia para afirmar que las varianzas poblacionales no son distintas. Ya que entramos en la regin de aceptacin para nuestra hiptesis nula.c) Determine, usando pruebas de hiptesis, si la temporada del ao incide en las medias poblacionales de las algas n.a6. y n.a2. (Use 97% de nivel de confianza. Obtenga el estadstico y p-valor)(1pts.). Aplicamos el comando t.test con un nivel de confianza de 97% para comparar las medias poblaciones de los tipos de alga n.a6. y n.a2. para cada poca del ao contra su respectivas medias globales.Para n.a6.Verano:

p-valor= 0.1836 t=-1.3447 Intervalo: [-7.688775 ; 1.890191]

En nuestra hiptesis nula asumimos que la media de n.a6. en verano y n.a6 global son iguales. Como alternativa que son diferentes.Ho: (ver6)= (n.a6.)Ha: (ver6) (n.a6.) = 0.03 /2 =0.015n1=43 n2=184Usando una tabla para la distribucin T-de Student se obtiene T2,17Regin de Rechazo { |T|> T/2;n1+n2-2} 1.3447>2,17 Falso. Se acepta Ho.

Invierno: p-valor= 0.3726 t= 0.8964, Intervalo: [-2.687836; 6.365046]

En nuestra hiptesis nula asumimos que la media de n.a6. en invierno y n.a6 global son iguales. Como alternativa que son distintas.Ho: (inv6)= (n.a6.)Ha: (inv6) (n.a6.) = 0.03 /2 =0.015

n1=57 n2=184

Usando una tabla para la distribucin T-de Student se obtiene T/22,17Regin de Rechazo { |T|> T/2;n1+n2-2} 0.8964>2,17 Falso.Se acepta Ho.Otoo: p-valor= 0.7681 t= 0.2964, Intervalo: [-4.00165 ; 5.228598]

En nuestra hiptesis nula asumimos que la media de n.a6. en otoo y n.a6 global son iguales. Como alternativa que son distintas.Ho: (oto6)= (n.a6.)Ha: (oto6) (n.a6.) = 0.03 /2 =0.015n1=36 n2=184Usando una tabla para la distribucin T-de Student se obtiene T/22,17Regin de Rechazo { |T|> T/2;n1+n2-2} 0.2964>2,17 Falso.Se acepta Ho.Primavera: p-valor= 0.98 t= -0.0251, Intervalo: [-4.104337 ; 4.012004]

En nuestra hiptesis nula asumimos que la media de n.a6. en primavera y n.a6 global son iguales. Como alternativa que son distintas.Ho: (pri6)= (n.a6.)Ha: (pri6) (n.a6.) = 0.03 /2 =0.015n1=48 n2=184Usando una tabla para la distribucin T-de Student se obtiene T/22,17Regin de Rechazo { |T|> T/2;n1+n2-2} 0.0251>2,17 Falso. Se acepta Ho.A partir de los resultados obtenidos de las cuatro pruebas de hiptesis realizadas se observa que no hay evidencia, para decir que la temporada del ao influye en las medias poblaciones del conjunto de algas tipo n.a6. Ya que en estas pruebas de hiptesis se aceptaron Ho: (epocai= global), y los intervalos de confianza arrojados por cada prueba contienen el cero, adems de incluir el valor del estadstico de cada prueba. Con lo que podemos confirmar que no existen diferencias.

Para n.a2.Verano:

p-valor= 0.7022 t= 0.3842 Intervalo: [-3.591128 ;5.092126]

En nuestra hiptesis nula asumimos que la media de n.a2. en verano y n.a2 global son iguales. Como alternativa que son diferentes.Ho: (ver2)= (n.a2.)Ha: (ver2) (n.a2.) = 0.03 /2 =0.015n1=43 n2=184Usando una tabla para la distribucin T-de Student se obtiene T/22,17Regin de Rechazo { |T|> T/2;n1+n2-2} 0,3842>2,17 Falso. Se acepta Ho.

Invierno: p-valor= 0.2962 t= -1.0507, Intervalo: [-5.515754 ;1.955265]

En nuestra hiptesis nula asumimos que la media de n.a2. en invierno y n.a2. global son iguales. Como alternativa que son distintas.Ho: (inv2)= (n.a2.)Ha: (inv2) (n.a2.) = 0.03 /2 =0.015n1=57 n2=184Usando una tabla para la distribucin T-de Student se obtiene T/2;2,17Regin de Rechazo { |T|> T/2;n1+n2-2} 1.0507>2,17 Falso.Se acepta Ho.Otoo: p-valor= 0.2304 t= -1.213, Intervalo: [-6.130666;1.808807]

En nuestra hiptesis nula asumimos que la media de n.a2. en otoo y n.a2. global son iguales. Como alternativa que son distintas.Ho: (oto2)= (n.a2.)Ha: (oto2) (n.a2.) = 0.03 /2 =0.015n1=36 n2=184Usando una tabla para la distribucin T-de Student se obtiene T/2;2,17Regin de Rechazo { |T|> T/2;n1+n2-2} 1.213>2,17 Falso. Se acepta Ho.Primavera: p-valor= 0.07283 t= 1.8188 Intervalo: [-0.6603596 ;6.7851894]

En nuestra hiptesis nula asumimos que la media de n.a2 en primavera y n.a2 global son iguales. Como alternativa que son distintas.Ho: (pri2)= (n.a2.)Ha: (pri2) (n.a2.) = 0.03 /2 =0.015n1=48 n2=183Usando una tabla para la distribucin T-de Student se obtiene T/2;2,17Regin de Rechazo { |T|> T/2;n1+n2-2} 1.8188>2,17 Falso. Se acepta Ho.A partir de los resultados obtenidos de las cuatro pruebas de hiptesis realizadas se observa que no hay evidencia, para decir que la temporada del ao influye en las medias poblaciones del conjunto de algas tipo n.a2. Ya que en estas pruebas de hiptesis se aceptaron Ho: (epocai= global), y los intervalos de confianza arrojados por cada prueba contienen el cero, adems de incluir el valor del estadstico de cada prueba. Con lo que podemos confirmar que no existen diferencias.

d) Determine, usando una prueba de hiptesis, si el nmero medio algas tipo n.a6.n pasa de 0 en el verano. (Use 92% de nivel de confianza. Obtenga el estadstico y p-valor, Calcule y trace la curva de potencia de esta prueba) (1pts.)

De nuevo utilizamos el comando t.test con un nivel de confianza de 92%, para el conjunto de algas de tipo n.a6 en verano. En esta prueba se tomaran la hiptesis como: Ho: (ver6)=0Ha: (ver6)>0t = 1.5571 p-valor= 0.127intervalo: [-0.4626581 ;6.5409336]=0.08n=43Como tenemos < p-valor 0.080 = 0.05 n=59Usando una tabla para la distribucin T-de Student se obtiene T;1141,66Regin de Rechazo { T> T;114} 0,9287>1,66 Falso. Se acepta Ho.Mediano: p-valor= 0.2083 t= -1.2637 Intervalo: [-6.826487 ;1.500706]Ho: (med2)- (med6.)=0Ha: (med2)- (med6.)>0 = 0.05 n=83Usando una tabla para la distribucin T-de Student se obtiene T;1641,64Regin de Rechazo { T> T;164} -1.2637>1,64 Falso. Se acepta Ho.

Grande: p-valor= 0.007794 t= 2.7374 Intervalo: [1.601664 10.;84185]Ho: (lar2)- (lar6)=0Ha: (lar2)- (lar6.)>0 = 0.05 n=42Usando una tabla para la distribucin T-de Student se obtiene T;1641,66Regin de Rechazo { T> T;82} 2.7374>1,66 Verdadero. Se rechaza Ho.

Solo hay evidencia para afirmar que la formacin de algas del tipo n.a2 es mayor en promedio que la media de formacin de algas del tipo n.a6 en ros de gran tamao (large). Por lo que la afirmacin inicial de los investigadores no es del todo correcta. No hay pruebas suficientes que demuestren mayor formacin en promedio de n.a2 en los tamaos pequeos y medianos.

b) Determine mediante prueba de hiptesis si la velocidad del rio afecta significativamente a la formacin de algas n.a2. y n.a6. (Use 95% de nivel de confianza. Obtenga el estadstico y p-valor).(1pts.)Para n.a6Baja: p-valor= 0.2006 t= 1.3027 Intervalo: [-2.036679 ;9.379528]Ho: (low6)- (n.a6)=0Ha: (low6)- (n.a6)0 = 0.05 n1=31 n2=184< p-valor 0.050 = 0.05 n1=77 n2=184< p-valor 0.050 = 0.05 n1=76 n2=184< p-valor 0.05p-valor 0.05>0.03823 Rechazamos la Hiptesis NulaAlta: p-valor= 0.01823 t= -2.3913 Intervalo: [-6.9290367;-0.6546974]Ho: (high2)- (n.a2)=0Ha: (high2)- (n.a2)>0 = 0.05 n1=76 n2=184>p-valor 0.05>0.01823 Rechazamos la Hiptesis NulaHay evidencia a un nivel de 95% de confiabilidad, para afirmar que la velocidad del rio incide en la formacin promedio para el conjunto de algas de tipo n.a2. Ya que a partir de la prueba de hiptesis para la velocidad media y alta, aceptamos la hiptesis alternativa, de que ambos valores promedios poseen diferencias significativas.

Pregunta 3

a) Ajuste un modelo de regresin mltiple que relacione el precio de las viviendas con las variables dadas. (1pts.)Al observar nuestra matriz de correlacin se puede apreciar que no existe una correlacin entre el precio y las seis variables, ya que el precio de por si depende de ellas y para ello se tiene una funcin, mientras que no tenemos ninguna funcin que relacione nuestras variables independientes y por eso ellas si poseen correlacin entre s.De esta manera, las variables que poseen mayor correlacin entre s son las que ms afectan a nuestro modelo, un ejemplo es la que existe entre la variable bedrooms y la variable sqft que posee un valor de 0.65809218. Por lo tanto, lo ms conveniente es tener correlacin pequea entre las variables, siendo un ejemplo el valor de -0.009715856 que hay entre la variable age y la variable vacant_lot.b) Lleve a cabo los anlisis y crtica completos del modelo obtenido y encuentre la combinacin de variables que mejor describen el precio de las viviendas. Redacte de forma adecuada la justificacin de su eleccin. (1pts.)Obtuvimos un modelo donde se observa que la variable que posee ms significancia es sqft, por lo tanto es la ms importante en mi modelo, mientras que la variable large_lot es la variable que aporta menor significancia, por lo tanto no afecta en gran proporcin al mismo. Sabiendo esto empezamos a eliminar las variables que aportan menor significancia ya que deseo tener un modelo con la menor cantidad de variables posibles para que sea ideal, siempre y cuando cumpla que los residuos tengan una distribucin normal y con el mayor R^2 posible, preferiblemente mayor a 0.75.La primera variable que eliminamos fue large_lot, ya que su valor de Signif. Codes es 1, y sabemos que eso implica una significancia muy baja para el modelo. Al eliminarla y obtener la grfica observamos que los puntos estn distribuidos prcticamente de manera normal, cumpliendo el requisito de los residuos, pero sigo teniendo un modelo con cinco variables, lo cual no es ideal.A continuacin, eliminamos la variable dist_freeway, ya que su valor de Signif. Codes es 0.05, siendo esto una significancia baja para el modelo. Al eliminarla y obtener la nueva grafica del modelo ajustado observamos que los puntos varan un poco con respecto a la grfica anterior, pero no es tan significativo el cambio, as que procedemos a eliminar otra variable.

La tercera variable que se elimino fue age, siendo su valor de Signif. Codes 0.01, ya que esta variable no aportaba mucho al modelo. Al eliminarla y obtener la nueva grafica de nuestro nuevo modelo ajustado observamos que los puntos varan con respecto a la grfica del modelo anterior y que los residuos siguen teniendo una distribucin normal, pero optamos por eliminar una ltima variable, para as obtener un modelo con solo dos variables, lo cual se acerca a lo ideal.La ltima variable que se elimino fue bedrooms, cuyo valor de Signif. Codes 0.05, ya que esta variable no posee gran aporte al modelo. Despus de eliminarla y obtener la nueva grafica observamos que los puntos varan con respecto a la grfica del modelo anterior, los residuos siguen una distribucin normal y finalmente tenemos un modelo con dos variables, siendo este nuestro modelo ideal.

c) Con el modelo obtenido Considera que las variables elegidas son suficiente para explicar toda la variabilidad de los datos? (1pts.)Con el modelo ajustado que obtuvimos podemos decir que las variables sqft y vacant_lot si son suficientes para explicar toda la variabilidad de los datos, ya que obtuvimos un R2 cuyo valor es 0.8102, siendo este un valor bastante bueno ya que mnimo debamos obtener un R2 de 0.75. Por lo que finalmente se puede concluir que tenemos un modelo ajustado ideal, con distribucin normal de los residuos, con dos variables y un R2 alto.

CONCLUSIONEste proyecto consta de tres partes donde las dos primeras van relacionas a las muestras de ros tomadas en distintas pocas del ao donde se encontraron diversas algas nocivas, especialmente el conjunto de algas tipo n.a6.n y n.a2. En principio se pide demostrar si las varianzas poblacionales de estos dos tipos de algas son distintas, si la poca del ao es factor en la aparicin promedio de los conjuntos de algas ms perjudiciales para un ro, y determinar si la formacin promedio de las algas n.a6.n pasa de cero en el verano. En la segunda parte se relacionan el tamao y velocidad del ro con la formacin media de los dos tipos de algas. Por ultimo en la parte 3 se busca la mejor combinacin de variables que representen los precios de las viviendas en una localidad especfica.Con respecto a la primera parte del proyecto se pudo concluir que las varianzas del crecimiento de los tipos de algas n.a6.n y n.a2.n no posee cambios significativos entre las distintas pocas del ao, ya que por los resultados obtenidos no hay evidencia para decir que las varianzas entre estos dos tipos sea distinta, para los especmenes n.a6.n y n.a2.n se pudo evidenciar que las pocas del ao no influyen en el crecimiento medio de las algas, es decir, cada tipo se producir una cantidad especfica, con muy pocas diferencias, independientemente la poca del ao en la que nos encontremos. Por ultimo si existe evidencia para decir que el crecimiento medio del alga tipo n.a6.n no pasara de cero, es decir no ser muy alto.En la segunda parte se observ que el crecimiento del tipo de alga n.a2.n es mayor que el de n.a6.n solo en ros de gran tamao, por ende los investigadores se equivocan al decir que esto sucede en todos los tamaos de ros, ya que no se encontraron pruebas para verificar una mayor formacin de algas n.a2, en el conjunto de ros de tamaos medianos y pequeos. Para el conjunto de algas tipo n.a2.n se dedujo que la velocidad del ro no incide en su crecimiento pero en el conjunto de algas de tipo n.a6.n si se encontr evidencia que la velocidad del rio mediana y alta afecta en su crecimiento, ya que para estos dos casos se encontraron diferencias entre la media local y su media global.Por ultimo en la tercera parte del proyecto se logr encontrar un modelo regresivo que relacione los precios de las viviendas con las variables, al dejar las variables sqft y vacant_lot se obtuvo un modelo ajustado ideal, con distribucin normal de los residuos, con dos variables y un R2 alto como se mencion anteriormente esto nos permitir ajustar un precio ideal y coherente con las variables y localidad de las viviendas.Cabe destacar la efectividad del programa utilizado, como es ERRE ya que a pesar de la cantidad de variables, y tener un tamao de muestra muy grande, para cada uno de los ejercicios, se determin el comportamiento de las variables ms importantes de estos conjuntos de datos. Adems usando los conocimientos tericos, tablas de distribuciones y otras herramientas. Se pudieron hacer verificaciones en nuestros anlisis obtenidos para estar seguros de que se ha hecho un trabajo confiable.

ANEXOS:Ejercicio1:Datos=read.table("C:/Users/Ramon/Downloads/algasfin.norm",header=T)attach(Datos)summary(Datos)temporada=factor(season)summary(temporada)tamano=factor(size)summary(size)velocidad=factor(speed)summary(speed)sqrt(var(mxPH))sqrt(var(mnO2))sqrt(var(C1))sqrt(var(NO3))sqrt(var(NH4))sqrt(var(oPO4))sqrt(var(Chla))sqrt(var(n.a1.))sqrt(var(n.a2.))sqrt(var(n.a3.))sqrt(var(n.a4.))sqrt(var(n.a5.))sqrt(var(n.a6.))sqrt(var(n.a7.))

inv6=n.a6.[season=="winter"]ver6=n.a6.[season=="summer"]pri6=n.a6.[season=="spring"]oto6=n.a6.[season=="autumn"]

inv2=n.a2.[season=="winter"]ver2=n.a2.[season=="summer"]pri2=n.a2.[season=="spring"]oto2=n.a2.[season=="autumn"]

var.test(inv6,inv2,conf.level=0.99)var.test(ver6,ver2,conf.level=0.99)var.test(pri6,pri2,conf.level=0.99)var.test(oto6,oto2,conf.level=0.99)

t.test(ver6,n.a6.,conf.level=0.97)t.test(inv6,n.a6.,conf.level=0.97)t.test(pri6,n.a6.,conf.level=0.97)t.test(oto6,n.a6.,conf.level=0.97)

t.test(ver2,n.a2.,conf.level=0.97)t.test(inv2,n.a2.,conf.level=0.97)t.test(pri2,n.a2.,conf.level=0.97)t.test(oto2,n.a2.,conf.level=0.97)

t.test(ver6,conf.level=0.92)

Ejercicio 2:lar6=n.a6.[size=="large"]med6=n.a6.[size=="medium"]peq6=n.a6.[size=="small"]

lar2=n.a2.[size=="large"]med2=n.a2.[size=="medium"]peq2=n.a2.[size=="small"]

t.test(peq2,peq6,conf.level=0.95)t.test(med2,med6,conf.level=0.95)t.test(lar2,lar6,conf.level=0.95)

low6=n.a6.[speed=="low"]med6=n.a6.[speed=="medium"]high6=n.a6.[speed=="high"]

t.test(low6,n.a6.,conf.level=0.95)t.test(med6,n.a6.,conf.level=0.95)t.test(high6,n.a6.,conf.level=0.95)

low2=n.a2.[speed=="low"]med2=n.a2.[speed=="medium"]high2=n.a2.[speed=="high"]

t.test(low2,n.a2.,conf.level=0.95)t.test(med2,n.a2.,conf.level=0.95)t.test(high2,n.a2.,conf.level=0.95)Ejercicio 3:names(house)attach(house)housepairs(house)cor(house)ajuste=lm(price~sqft+age+bedrooms+vacant_lot+large_lot+dist_freeway)summary(ajuste)%Borramos large_lot%ajuste1=lm(price~sqft+age+bedrooms+vacant_lot+dist_freeway)summary(ajuste1)%Borramos dist_freeway%ajuste2=lm(price~sqft+age+bedrooms+vacant_lot)summary(ajuste2)%Borramos age%ajuste3=lm(price~sqft+bedrooms+vacant_lot)summary(ajuste3)qqnorm(resid(ajuste3))qqnormqqline(resid(ajuste3))plot(resid(ajuste3))abline(h=0)%Borramos bedrooms%ajuste4=lm(price~sqft+vacant_lot)summary(ajuste4)qqnorm(resid(ajuste4))qqnormqqline(resid(ajuste4))plot(resid(ajuste4))abline(h=0)