PROYECTO 2 ESTADISTICA

18
7/23/2019 PROYECTO 2 ESTADISTICA http://slidepdf.com/reader/full/proyecto-2-estadistica 1/18 Universidad Simón Bolívar Departamento de Cómputo Científico y Estadística CO3321 Estadística para Inenieros!"atem#ticos Septiem$re%Diciem$re 2&1' (royecto 2 Interantes)* %David +lie, Carnet) 11%1&-&& %.uusto /ara0ona, Carnet) 1&%1113- %Dieo Borneo, Carnet) 11%1&11  %Cristian (erdomo, Carnet) 1&%113-2 Sarteneas 21 de noviem$re de 2&1',

Transcript of PROYECTO 2 ESTADISTICA

Page 1: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 1/18

Universidad Simón Bolívar 

Departamento de Cómputo Científico y Estadística

CO3321 Estadística para Inenieros!"atem#ticos

Septiem$re%Diciem$re 2&1'

(royecto 2

Interantes)*

%David +lie, Carnet) 11%1&-&&

%.uusto /ara0ona, Carnet) 1&%1113-

%Dieo Borneo, Carnet) 11%1&11

  %Cristian (erdomo, Carnet) 1&%113-2

Sarteneas 21 de noviem$re de 2&1',

Page 2: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 2/18

RESUMEN.

En estadística 4ay situaciones en las cuales se 5uiere sa$er si ciertos par#metros de inter6s

 para un investiador cumplen cierta propiedad o est#n dentro de un conunto específico es

entonces cuando sure la utilidad de las prue$as de 4ipótesis,

Una prue$a de 4ipótesis es un procedimiento en el cual el investiador supone un valor para

sus par#metros y determina si la suposición puede ser rec4a0ada o no con cierto rado de

confia$ilidad,

(or otro lado 4ay casos en los cuales se tiene un conunto de datos relacionados y se 5uiere

de aluna manera encontrar un patrón 5ue ayude a predecir de forma precisa un valor 

desconocido y relacionado con esas condiciones, 7os modelos de reresión lineal son

4erramientas 5ue permiten predecir este valor desconocido,

El propósito de este informe es estudiar la aplicación de estos modelos usando 8 en

situaciones de importancia para aluna investiación de un #rea de estudio como la

computación medicina economía o cual5uier otra disciplina 5ue re5uiera un an#lisis de

datos,

Page 3: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 3/18

PRIMERA PARTE (a) (Análisis Descriptivo)

Se clasificaron el ala n,a2 y n,a9 se:n la temporada en las 5ue fueron recolectadas el

tama;o del río y la velocidad del río y se o$tuvo lo siuiente)

.la n,a2 "in,

<1

"ediana

"edia

<3

"a*,

/emp

orada

=au

tumn>

%

21,?9

&

,32&9

'

,?3'&

'

,'2'&

@

,@'@&

2

2,21

=sp

rin>

%

,3--@

1

,239

@

,?@9

@

,9'?

1

-,9-&

3

',-3&

=su

mmer>

%

23,22

&

,&&'

,&?@

?

,33-

1

-,1@

3

&,2?

=Ai

nter>

%

2&,91&

%

2,?9

9

,391

'

,&'

1

3,'&

2

-,1-&

/ama

;o de 8io

=lar 

e>

%

3,@11

3

,-9

@

,@

1

&,1'&

1

9,33&

2

?,-1&

=m

6dium>

%

23,22

%

1,'39

?

,29-

9

,1@'

1

',@1&

3

&,2?&

=s

mall>

%

2&,91&

%

2,&2?

'

,-@-

'

,9&-

1

2,1&

3

',-3&

eloci

dad 8io

=4i

4>

%

23,22

%

-,-39

1

,'11

2

,?@3

1

2,-1&

3

&,2?&

=sl

oA>

%

21,?9

3

,1

@

,'-1

,?1

1

',?3

2

2,@3

=m

6dium>

%

1&,-2

2

,-@1

@

,12-

@

,'&?

1

-,9@&

3

',-3&

Page 4: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 4/18

Tabla 1- Analisis Descriptivo para la ala n.a!

Se puede o$servar 5ue la media muestral se:n la estación es mayor en sprin se:n el

tama;o del río la media m#s alta esta para los ríos =lare> y para la velocidad del río

medium fue la m#s alta, (or otra parte las medias mas $aas se o$tuveron en autum

small y 4i4,

En cuanto a las alas n,a9 se o$tuvo lo siuiente)

.la n,a9 "

in,

<

1

"

ediana

"

edia

<

3

"

a*,

/emporada

=a

utumn>

%

1,-

%

&,392

?

,@

9

,--2&

1

3,&

3

',&?

=s

 prin>

%

11,3'

%

1,231

2

,?'

-

,@2

?

,1

3

@,--&

=s

ummer>

%

2@,@2&

%

',@99

'

,&?

3

,&3@

1

1,32

2

?,2@

=A

inter>

%

19,@3&

%

1,-@3

-

,&-

?

,???

1

3,2

'

?,2-

/a

ma;o de

8io

=la

re>

%

1,-

%

2,&

3

,31?

'

,2'3

1

&,'

3

?,?3&

=

m6dium>

%

2@,@2

%

1,?31

@

,3-3

,-?

1

?,@&

'

?,2-&

=s

mall>

%

9,929

%

&,2-&

2

,?'&

3

,&3@&

9

,'@&

1

,32

el

ocidad de

8io

=4

i4>

%

2&,1&

%

1,@&@

3

,?3-

-

,1&@

1

&,33

'

2,-'

=sl

oA>

%

1,-

&

,-@2

?

,-&

@

,91&

1

,&3

'

?,2-&

=

m6dium>

%

2@,@2

%

1,-?-

'

,311

-

,2?@

1

1,'2

3

?,?3

Tabla !- Análisis "escriptivo "e la ala n.a#

Se puede o$servas 5ue las mayores medias muestrales se tienen en la temporada autum el

tama;o =m6dium> y la velocidad sloA, "ientras 5ue las mas $aas se reistraron en la

temporada =summer> lare> y 4i4,

/am$i6n ca$e destacar 5ue la media muestral sin clasificar por ninuna cateoría de n,a2

9,-'-F es mayor 5ue la de n,a9 -,@3'F, (or lo 5ue se puede pensar 5ue la po$lación de

alas n,a2 es mayor en eneral 5ue la de n,a9,

Gráfco 1- Boxplot de la población de algas por temporada, por tamaño de río y porvelocidad del mismo (En el mismo orden de la tabla 1

Page 5: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 5/18

PRIMERA PARTE (b) (co$paraci%n "e varian&as)

Se reali0a una proramación de los datos para 5ue realice una prue$a con una 4ipotesis nula

Go) σ 2

n . i . n−σ 2

n . i . n=0  contra Ga) σ 2

n . i . n−σ 2

n . i .n≠0  con iHa2a9 para cada alaF

 para cada temporada,

Es decir se 5uiere ver si las varian0as de cada ala no cam$ia de una temporada GoF o si GaF

con un nivel de confian0a 1−α =0.99 , Se o$tuvieron los siuientes resultados del valor

del estadistico de prue$a el p valor y conclusion respecto al no rec4a0o de la 4ipotesis nula

GoH&F o su rec4a0o GoH1F)

Tabla '. o$paracion "e varian&as

(uede verse 5ue con los datos aportados no e*iste suficiente evidencia para afirmar 5ue las

varian0as en la aparicion de am$as alas n,a2,n y n,a9,n para cada una de las temporadas

sean distintas GoH&H no se rec4a0a la 4ipotesis nulaF en ninuno de los casos con un nivel de

confian0a del @@, Es decir la varian0a de ninuna de las dos alas cam$ia con la temporada,

PRIMERA PARTE (c) (co$paraci%n "e $e"ias)

Se reali0a una proramación de los datos para 5ue realice una prue$a con una 4ipotesis nula

Go)  μn .i . n− μn .i . n=0  contra Ga)  μn . i . n− μn . i . n≠0  con iHa2a9 para cada alaF para

cada temporada,

Es decir se 5uiere ver si las medias po$lacionales de cada ala no cam$ia de una temporada

GoF o si GaF con un nivel de confian0a 1−α =0.97 , Se o$tuvieron los siuientes

resultados del valor del estadistico de prue$a el p valor y conclusion respecto al no rec4a0ode la 4ipotesis nula GoH&F o su rec4a0o GoH1F)

Gráfco !- Boxplot de las algas na" por temporada, tamaño de río yvelocidad del río

Page 6: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 6/18

tabla . o$paracion "e $e"ias

Se o$serva 5ue la evidencia muestral revela 5ue para la ala n,a2,n su media po$lacional si

varia 4oH1H se rec4a0a 4ipotesis nulaF entre las temporadas de oto;o%primavera y primavera%

invierno con un nivel de confian0a del @?,

(ara las demas temporadas el numero medio de la ala n,a2,n no revela cam$ios 4oH&H no serec4a0a 4ipotesis nulaF y para la ala n,a9,n no e*iste evidencia muestral 5ue e*ista diferencia

sinificativa en su cantidad media para ninun par de temporadas en el mismo nivel de

 prue$a,

PRIMERA PARTE (") (n*$ero $e"io "e alas n.a#.n en verano)

Se reali0a una proramación de los datos para 5ue realice una prue$a con una 4ipotesis nula

Go)  μn .a 6. n=0  contra Ga)  μn .a 6. n>0 ,

Es decir se 5uiere ver si la media po$lacional de la ala tipo n,a9,n es iual a cero GoF o es

mayor 5ue cero durante el verano GaF con un nivel de confian0a 1−α =0.92 , Se

o$tuvo 5ue el estadistico de prue$a dio 1,--? el p%valor &,&93',

Como α > p−valor=0.08>0.063  por lo tanto para la prue$a reali0ada y con el valor del

estadistico dado se concluye 5ue se rec4a0a la 4ipotesis nula,

(or lo tanto dada la evidencia muestral podemos concluir con una confian0a del @2 5ue la

 po$lacion media de alas tipo n,a9,n sera mayor 5ue cero para la temporada de invierno, 7a

curva de potencia de la prue$a se muestra acontinuacion)

Page 7: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 7/18

+ra,ico '. Potencia "e la preba con na probabili"a" $ini$a "e #.' "e rec/a&ar la/ipotesis nla can"o ha : μn .a 6. n>0 . Se observa a $e"ia se to$a n valor ca"a ve&

$as alto "e la /ipotesis alternativa la probabili"a" "e rec/a&ar la /ipotesis nla es

$a0or.

Page 8: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 8/18

SE+UNDA PARTE.-(a) co$paraci%n "e $e"ias "e n.a! 0 n.a# con respecto al ta$ao

"e r2o

 Juestra Go es 5ue la media de na,2 es iual a na,9 y la alternativa es 5ue la media de na,2 es

mayor a la media de n,a9 para cada nivel de tama;o de río,

Se calculó el estadístico de prue$a y el p%valor, Se compara el p%valor con el valor KH&,&- ysi es menor se rec4a0a la 4ipótesis,

Se utili0ó el comando t,test para o$tener lo valor del estadístico de prue$a y el p%valor 

Ta$ao Esta"2stico "e

preba

P-valor se rec/a&a

34

n.a!. - n.a#. lare 2?3? &&&' Sí

n.a!. - n.a#. medium %129' &@9 Jo

n.a!. - n.a#. small &@2@ &1? Jo

7os datos de la muestra permiten rec4a0ar 5ue la media de na,9 es iual a la de n,a2 en ríos detama;o) lare randeF afirmando 5ue la media de na,2 es mayor en este escenario conconfia$ilidad de @-,

SE+UNDA PARTE.- (b) co$paraci%n "e $e"ias "e n.a! 0 n.a# con respecto a la

veloci"a" "e r2o

 Juestra Go es 5ue la media de na,2 es iual a na,9 y la alternativa es 5ue la media de na,9 esdiferente a la media de n,a2 para cada nivel de tama;o de río,

Se utili0ó el comando t,test para o$tener lo valor del estadístico de prue$a y el p%valor 

5eloci"a" Esta"2stico "e

preba

P-valor Se rec/a&a

34

n.a!. - n.a#. Gi4 %12,122,1&- &,22?33?2 Jo

n.a!. - n.a#. 7oA %&,23&23@ &,12-'9 Jon.a!. - n.a#. medium 23,91-,'1 &,&1@-3'1- Sí

7os datos de la muestra permiten rec4a0ar 5ue la media de na,9 es iual a la de n,a2 en ríos develocidad) medium medianaF afirmando 5ue la media de na,9 es mayor en este escenario conconfia$ilidad de @-,

Page 9: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 9/18

TERERA PARTE6 RE+RESI7N 8INEA8 MU8TIP8E

(ara esta actividad se tiene una ta$la con los precios de ciertas viviendas y las características

5ue influyen en el precio de la misma, Se 5uiere determinar cu#l de estas varia$les tiene

mayor influencia so$re el precio de estas viviendas y austarlas a un modelo de reresión

lineal,

El primer modelo 5ue se o$tuvo fue el de todas las varia$les involucradas este es)

−¿ freeway

−¿lot −0.9373dist ¿−¿ lot +0.0158 large

¿

 price=10.8980+0.0649 sqft −0.0013age−0.0451 bedrooms−0.057 vacant ¿

Este modelo tuvo como coeficientes m#s sinificativos 1&,@& termino

independienteF y &,&9'@ y menos sinificativos %&,&'-1 L %&,@3?3 y &,&1-, Como estas

:ltimas varia$les son las menos sinificativas recalcular el modelo sin estas varia$les de$e

afectar muy poco el modelo oriinal,

8epitiendo este procedimiento viilando 5ue los valores 8%cuadrado m:ltiple no

cam$ien sustancialmente se lleó a 5ue el modelo m#s pe5ue;o 5ue meor descri$e los datos

es el modelo)  price=10.6829+0.0637 sqft   

Este modelo lineal simple es el 5ue meor descri$e las el precio pues los coeficientes

 β0

, β1  tienen un p%valor de 2∙10

−16  lo cual para efectos pr#cticos se pueden

apro*imar a & y en consecuencia para todo α , p−valor<α   por lo cual estos valores son

sinificativos para el modelo, .dem#s la correlación lineal entre price> y =s5ft> es $astante

cercana a 1 &,@?1-2&F lo cual apoya tam$i6n este modelo como un $uen descriptor de los

 precios de los inmue$les,

Se puede o$servar 5ue los datos de los residuales son normales en el r#fico 1,

Page 10: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 10/18

+rá,ico ' 9 Nor$ali"a" "el error "e esti$acion

7os errores est#n acotados entre %2 y 3 y no siuen nin:n patrón, Minalmente los valoes de la

varia$le s5ft son independientes de los errores como se o$serva en el r#fico 2,

Concluido todo este an#lisis de los residuos del modelo y de valores sinificativos se puede

decir 5ue este modelo con las varia$les es el 5ue meor trata de descri$ir los precios de las

viviendas

Gráfco #- $arian%a del error, e independencia de la variable s&'t del error

Page 11: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 11/18

7N8USI7NES

Culminadas las prue$as actividades y los an#lisis correspondientes se puede determinar 5ue

dado 5ue no se pudo rec4a0ar la 4ipótesis nula en ninuna de las prue$as de varian0a de la

 primera parte la varian0a de las po$laciones de alas no se ven afectadas por la temporada en

la 5ue se realice la prue$a,

.lunas po$laciones de alas si se ven afectadas por las temporadas pues si se perci$ieron

cam$ios en las medias po$lacionales con el uso de las prue$as de 4ipótesis, N por :ltimo en el

verano las alas n,a9 la media po$lacional de alas en los ríos es mayor 5ue cero pues se

 proporcionó suficiente evidencia para 5ue la prue$a de 4ipótesis rec4a0ara la suposición de

5ue la media po$lacional en verano es cero,

En la seunda parte se compararon los crecimientos de las alas de acuerdo al tama;o del río

y de la velocidad en particular 5ue la media del ala n,a2 fuera mayor 5ue la de n,a9, Con el

tama;o de río rande las muestras arroaron suficiente evidencia para decir 5ue la media de

n,a2 era mayor 5ue n,a9 pero con los otros tama;os la evidencia no proporcionó información

suficiente para aceptar esta 4ipótesis,

En cuanto a la velocidad de los ríos se puede decir 5ue al menos los ríos con una velocidad

moderada afectan de manera sinificativa el crecimiento de las alas pero como sucedió en

 para los tama;os del río la evidencia no pudo confirmar la e*istencia de diferencia

sinificativa entre las alas,

Con respecto al modelo de reresión lineal se puede decir 5ue no todas las varia$les 5ue

determinan un cierto valor respuesta tienen influencia e5uitativa en la determinación de este

valor, 7as varia$les con mayor correlación lineal tienen mayor influencia mientras 5ue las

menos correlacionadas podrían uar un papel desprecia$le en el modelo tanto 5ue podría

 prescindirse se ellas, /al es el caso del modelo estudiado para el cual se tenían 9 varia$les

 pero al final la varia$le m#s influyente era una sora =s5ft>,

Page 12: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 12/18

ANE:7S (SRIPT)

(8ONEC/O 2

7ectura de la /a$la

ta$laHread,ta$lePalasfin,normP4eaderH/FL

columnasHcolnamesta$laFL

(8I"E8 (8OB7E".

.n#lisis descriptivo de las varia$les

 printP.nalisis descriptivo de las varia$lesPF

dev,neAF

 parmfroAHc13FF

 $o*plotsplitta$laQ13Rta$laseasonFmainHP(o$lacion de ala n,a2 por/emporadaPcolHcPdarTorane1PPforestreenPPold1PPdeepsTy$luePFyla$HPn,a2,PF

 $o*plotsplitta$laQ13Rta$lasi0eFmainHP(o$lacion de ala n,a2 por tamanio delrioPcolHcPdarTorane1PPforestreenPPold1PFyla$HPn,a2,PF

 $o*plotsplitta$laQ13Rta$laspeedFmainHP(o$lacion de ala n,a2 por velocidad delrioPcolHcPred3PPforestreenPP$luePFyla$HPn,a2,PF

fori in levelsta$laseasonFF

 printsprintfPtemporada s n,a2PiFF

 printsummaryta$laQta$laseasonHHi13RFF

V

 printWWF

for i in levelsta$lasi0eFF

 printsprintfPtamanio rio s n,a2PiFF

 printsummaryta$laQta$lasi0eHHi13RFF

V

 printWWF

for i in levelsta$laspeedFF

 printsprintfPvelocidad rio s n,a2PiFF

 printsummaryta$laQta$laspeedHHi13RFF

V

dev,neAF

 parmfroAHc13FF

 $o*plotsplitta$laQ1?Rta$laseasonFmainHP(o$lacion de ala n,a9 por

/emporadaPcolHcPdarTorane1PPforestreenPPold1PPdeepsTy$luePFyla$HPn,a9,PF

Page 13: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 13/18

 $o*plotsplitta$laQ1?Rta$lasi0eFmainHP(o$lacion de ala n,a9 por tamanio delrioPcolHcPdarTorane1PPforestreenPPold1PFyla$HPn,a9,PF

 $o*plotsplitta$laQ1?Rta$laspeedFmainHP(o$lacion de ala n,a9 por velocidad delrioPcolHcPred3PPforestreenPP$luePFyla$HPn,a9,PF

 printPPFL

fori in levelsta$laseasonFF

 printsprintfPtemporada s n,a9PiFF

 printsummaryta$laQta$laseasonHHi1?RFF

V

 printPPF

for i in levelsta$lasi0eFF

 printsprintfPtamanio rio s n,a9PiFF

 printsummaryta$laQta$lasi0eHHi1?RFF

V

 printPPF

for i in levelsta$laspeedFF

 printsprintfPvelocidad rio s n,a9PiFF

 printsummaryta$laQta$laspeedHHi1?RFF

V

Comparacion de varian0as para de las alas n,a2, y n,a9,

 printWComparacion de varian0as para las alas n,a2, y n,a9,WF

estacionesHlevelsta$laseasonFL

colsHcF

4ipXvarsHmatri*nroAH12ncolH3FL

colnames4ipXvarsFY%cPEstadistico de prue$aPP(%valorPPse rec4a0a G&PF

roAnames4ipXvarsFY%roAnames4ipXvarsdo,JU77HMprefi*HWalaWF

for i in 1)lent4columnasFF

if columnasQiRHHWn,a2,W ZZ columnasQiRHHWn,a9,WF

colsHappendcolsiF

V

V

TH1L

testHJU77L

A4ile lent4estacionesF[H&F

au*HestacionesQ1RL

estacionesHestacionesQ%1RL

au*tHta$laQta$laseasonHHau*colsRL

Page 14: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 14/18

fori in estacionesF

au*iHta$laQta$laseasonHHicolsRL

c1Hau*tQ1R

c2Hau*iQ1R

if varc1FYvarc2FF

testHvar,testc2c1conf,levelH&,@@F

V else

testHvar,testc1c2conf,levelH&,@@F

V

4ipXvarsQT1RHteststatistic

4ipXvarsQT2RHtestp,value

4ipXvarsQT3RHtestp,valueYH1%&,@@roAnames4ipXvarsFQTRY%sprintfPs s%sPPn,a2,Pau*iFL

c1Hau*tQ2R

c2Hau*iQ2R

if varc1FYvarc2FF

testHvar,testc2c1conf,levelH&,@@F

V else

testHvar,testc1c2conf,levelH&,@@F

V

4ipXvarsQT\91RHteststatistic

4ipXvarsQT\92RHtestp,value

4ipXvarsQT\93RHtestp,valueYH1%&,@@

roAnames4ipXvarsFQT\9RY%sprintfPs s%sPPn,a9,Pau*iFL

THT\1L

V

V

 print4ipXvarsF

estacionesHlevelsta$laseasonF

Incidencia de las estaciones en el crecimiento de las alas n,a2, n,a9,

 printPIncidencia de las estaciones en el crecimiento de las alas n,a2, n,a9,PFL

4ipXdmedHmatri*nroAH12ncolH3F

colnames4ipXdmedFY%cPEstadistico de prue$aPP(%valorPPse rec4a0a G&PF

roAnames4ipXdmedFY%roAnames4ipXvarsdo,JU77HMprefi*HWalaWF

TH1L

A4ile lent4estacionesF[H&F

Page 15: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 15/18

au*HestacionesQ1RL

estacionesHestacionesQ%1RL

au*tHta$laQta$laseasonHHau*colsRL

testHJU77L

fori in estacionesF

au*iHta$laQta$laseasonHHicolsRL

c1Hau*tQ1R

c2Hau*iQ1R

testHt,testc2c1conf,levelH&,@?F

4ipXdmedQT1RHteststatisticL

4ipXdmedQT2RHtestp,value

4ipXdmedQT3RHtestp,valueYH1%&,@?roAnames4ipXvarsFQTRY%sprintfPs s%sPPn,a2,Pau*iFL

c1Hau*tQ2R

c2Hau*iQ2R

testHt,testc2c1conf,levelH&,@?F

4ipXdmedQT\91RHteststatisticL

4ipXdmedQT\92RHtestp,value

4ipXdmedQT\93RHtestp,valueYH1%&,@?

roAnames4ipXvarsFQT\9RY%sprintfPs s%sPPn,a9,Pau*iFL

THT\1L

V

V

 print4ipXdmedF

Jumero medio de alas tipo n,a9, mayor 5ue cero en verano ]F

 printWEs numero medio de alas n,a9 en verano es mayor 5ue cero ]FWF

c1Hta$laQta$laseasonHHWsummerW1?R

n1Hlent4c1F

vHvarc1F

testHt,testc1alternativeHWreaterWconf,levelH&,@2FL

 printP7a media de las alas m,a9, en verano es mayor 5ue cero con confian0a de @2PFL

 printsprintfP Estadistico de prue$a) s p%valor) s rec4a0ado G&)sPteststatistictestp,valuetestp,valueYH1%&,@2FFL

Curva de potencia

*Hse5&1&&&,1FL

yH1%pt&%*F!v!s5rtn1FFdfHn1%1F

Page 16: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 16/18

dev,neAF

 plot*ytypeHWlWmainHPCurva de potencia para la prue$a de n,a9, mayor 5ue & enveranoPcolHWoraneredW *la$HWalor alternativoWyla$HP(ro$a$ilidadPFL

rmestaciones*yvau*iF

Seunda (arte

(arte .) Comparacion de las medias po$lacionales de n,a9 y n,a2 para cada tama;o de río

 printPSeunda (artePFL

tamXvelHlevelsta$lasi0eF

4ipXdmedrHmatri*nroAH3ncolH3F

colnames4ipXdmedrFY%cPEstadistico de prue$aPP(%valorPPse rec4a0a G&PF

roAnames4ipXdmedrFY%roAnames4ipXdmedrdo,JU77HMprefi*HWalaWF

TH1L

for i in tamXvelF

au*tHta$laQta$lasi0eHHicolsR

c1Hau*tQ1R

c2Hau*tQ2R

testHt,testc1c2alternativeHWreaterWF

4ipXdmedrQT1RHteststatistic

4ipXdmedrQT2RHtestp,value

4ipXdmedrQT3RHtestp,valueYH1%&,@-roAnames4ipXdmedrFQTRY%sprintfPn,a2, % n,a9, tamnio sPiF

THT\1

V

 printPComparacion de medias de las alas n,a9, y n,a2 de acuerdo al tamanio del rioPFL

 print4ipXdmedrF

(arte B) Comparación de "edias po$lacionales de las alas n,a2 y n,a9, para cada velocidad de río

tamXvelHlevelsta$laspeedFL

4ipXdmedvHmatri*nroAH3ncolH3F

colnames4ipXdmedvFY%cPEstadistico de prue$aPP(%valorPPse rec4a0a G&PF

roAnames4ipXdmedvFY%roAnames4ipXdmedrdo,JU77HMprefi*HWalaWF

TH1

fori in tamXvelF

au*tHta$laQta$laspeedHHicolsR

c1Hau*tQ1R

c2Hau*tQ2R

testHt,testc1c2F

Page 17: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 17/18

4ipXdmedvQT1RHteststatistic

4ipXdmedvQT2RHtestp,value

4ipXdmedvQT3RHtestp,valueYH1%&,@-

roAnames4ipXdmedvFQTRY%sprintfPn,a2, % n,a9, velociad sPiF

THT\1

V

 printPComparacion de medias de de las alas n,a9, y n,a2 de acuerdo a la velocidad del rioPF

 print4ipXdmedvFL

rmau*ttamXvelc1c2colstestn1Tau*iF

/ercera parte

lectura de las varia$les

casasHread,ta$leW4ouseXprices2,t*tW4eaderH/FcasasHcasasQc1)?FR

 priceHcasasprice

s5ftHcasass5ft

aeHcasasae

 $edroomsHcasas$edrooms

vacantXlotHcasasvacant

lareXlotHcasaslareXlot

distXfreeAayHcasasdistXfreeAay

corXvarsHcorcasasuseHWcomplete,o$sWF Correlacion entre las varia$les,

O$tención del modelo lineal con todas las varia$les

modeloXcompletoHlmprice^s5ft\ae\$edrooms\vacantXlot\lareXlot\distXfreeAayF .uste contodas las varia$les

 printP/E8CE8. (.8/EPF

 printP"odelo con todas las varia$lesPF

 printsummarymodeloXcompletoFF

.n#lisis y crítica completo del modelo o$tenido

corXvarsHcorcasasuseHWcomplete,o$sWF Correlacion entre las varia$les,

 printPCorrelacion e*istente entre las varia$les independientes y la varia$le respuestaPF

 printcorXvarsQ1c2)?FRF

dev,neAF

 pairscasasmainHPCuadro de dispersion de los datos por cada par de varia$lesPla$elsHcP(recioPP(iesCuadradosPP.ntiuedadPPCant, Ga$,PP7ote acantePP7ote _randePPDist .utopistaPFF

Bus5ueda del meor modelo

 printP"odelo sin lare lotPF

 modeloHlmprice^s5ft\ae\$edrooms\vacantXlot\distXfreeAayF

Page 18: PROYECTO 2 ESTADISTICA

7/23/2019 PROYECTO 2 ESTADISTICA

http://slidepdf.com/reader/full/proyecto-2-estadistica 18/18

 printsummarymodeloFFL

 printP"odelo sin DistXfreeAayPF

 modeloHlmprice^s5ft\ae\$edrooms\vacantXlotF

 printsummarymodeloFF

 printP"odelo sin aePF

 modeloHlmprice^s5ft\$edrooms\vacantXlotF

 printsummarymodeloFF

 printP"odelo sin $edroomsPF

modeloHlmprice^s5ft\vacantXlotF

 printsummarymodeloFF

El modelo lineal 5ue meor se austa al precio de las viviendas es el modelo (recioH $&\$1`s5ftF lasinificancia de las varia$les es la mas alta W```WF

 printP"EO8 "ODE7OPF

meorXmodeloHlmprice^s5ftF

 printsummarymeorXmodeloFF

ustificación del meor modelo

dev,neAF

 parmfroAHc12FF

rHrstandardmeorXmodeloF

55normrmainHPDistri$ucion de los valores residualesPcolHWred2W*la$HPCuantiles/eoricosPyla$HPCuantiles de muestraPF

55linerF

 $o*plotrmainHPDistri$ucion de los cuantilesPcolHWoraneWyla$HP"uestra Jormali0adaPF

C4e5ueo de la 4omeocedasticidad

dev,neAF

 parmfroAHc12FF

 plotfitted,valuesmeorXmodeloFrmainHPDispersion de los datosaustadosPcolHPdeepsTy$lueP*la$HPalores austadosPyla$HPError estandarPFL

 plots5ftQ[is,napriceFRrmainHPDispersion de los datos (ie,CuadradoPcolHPold3P*la$HPalores des5ftPyla$HPError estandarPFL

Con este modelo dependiente solo de los pies cuadrados de terreno se puede modelarsatisfactoriamente el precio de la las casas

rmaes5ftdistXfreeAayvacantXlotlareXlotmeorXmodelomodelo$edroomsF