000 Eeie II Juny2011 Solucio

5
ESTADÍSTICA ECONÒMICA I EMPRESARIAL II JUNY 2011 NOM i COGNOMS: NIUB: 1a. (PUNTS 1). Sabem que una població X segueix una distribució normal amb paràmetres desconeguts. D’una mostra extreta d’aquesta s’han obtingut els següents descriptius. Quina és la probabilitat que la variància poblacional sigui igual o superior a: 7,4? ( ) ( ) ( ) ( ) ( ) 025 , 0 86 , 16 86 , 16 * ) 1 ( 4 , 7 16 , 4 * 30 16 , 4 * 30 4 , 7 ) 1 ( 4 , 7 1 , 2 1 2 1 2 2 * 2 * 2 2 2 1 2 2 * = = = = n n n P P S n P S n P P S n N X χ χ σ σ σ χ σ σ μ 2a.- (PUNTS 1,5). Sigui una variable aleatòria X que es distribueix com una normal de paràmetres N(μ,σ). S’ha obtingut una mostra de mida n=9 de la qual s’ha extret que la mitjana és 39,11 i la quasi-variància és 49,61. Obtingui un interval de confiança per a un nivell de significació de α=0.05. La resolució, aparentment correcta, és la següent: Atès que la variable aleatòria es distribueix com una Normal, la distribució de la mitjana mostral serà: n N X σ μ , . Per tant, l’interval de confiança és: α σ μ σ α α = + 1 2 2 n Z X n Z X P . Així, en aquest cas específic, i substituint pels valors mostrals, ( ) 35 , 2 * 96 , 1 11 , 39 35 , 2 * 96 , 1 11 , 39 95 , 0 3 04 , 7 96 , 1 11 , 39 3 04 , 7 96 , 1 11 , 39 + = + μ μ P P . Per tant, l’interval de confiança és: ( ) 95 , 0 71 , 43 51 , 34 = μ P . On està l’error de la resolució proposta?. Justifiqui la seva resposta i proposi l’interval de confiança correcte. L’error es troba en que no es coneix la variància poblacional. Atès que s’ha de d’utilitzar una estimació d’aquesta, si bé s’ha fet bé en substituir la variància poblacional per la mostral, no s’ha fet bé en fer servir la distribució normal, ja que en aquest cas s’ha d’utilitzar la t-student. Així ( ) 95 , 0 52 , 44 70 , 33 95 , 0 3 04 , 7 30601 , 2 11 , 39 3 04 , 7 30601 , 2 11 , 39 1 1 , 2 1 , 2 = = + = + μ μ α μ α α P P n S t X n S t X P n n 3a. (PUNTS 1). Sigui una mostra aleatòria simple extreta d’una població que es distribueix normalment amb paràmetres μ i σ. Es proposen els següents dos estimadors per al paràmetre poblacional μ. Obtingui el Biaix dels dos estimadors proposats. ( ) 2 2 ˆ ˆ 3 1 2 2 1 1 + = = = = = n X X n X n i n n i i i n i i μ μ ( ) { ( ) ( ) ( ) ( ) ( ) ( ) ( ) { [ ] ( ) ( ) μ μ μ μ μ μ μ μ μ μ μ μ μ μ μ μ 2 5 2 2 3 2 3 ˆ ˆ 2 3 6 ) 3 ( 2 1 2 2 2 2 1 2 2 ˆ 0 ˆ ˆ 1 1 ˆ 2 2 1 2 3 1 3 1 2 2 1 1 1 1 1 1 = + / + / = + = = + = = + = + + + + + = + = = = = / / = + = + + = = = = = n n n n n n E BIAIX n n n n X X X X X E n n X X E E E BIAIX n n X E X E n n X X E n X E E mas n n n n n i n n i i i n MAS n n i i L L L

description

examen junio

Transcript of 000 Eeie II Juny2011 Solucio

Page 1: 000 Eeie II Juny2011 Solucio

ESTADÍSTICA ECONÒMICA I EMPRESARIAL II JUNY 2011 NOM i COGNOMS: NIUB: 1a. (PUNTS 1). Sabem que una població X segueix una distribució normal amb paràmetres desconeguts. D’una mostra extreta d’aquesta s’han obtingut els següents descriptius. Quina és la probabilitat que la variància poblacional sigui igual o superior a: 7,4?

( ) ( ) ( )

( ) ( ) 025,086,1686,16

*)1(4,7

16,4*3016,4*30

4,7)1(

4,71,

21

21

2

2*

2*

222

12

2*

≈≤=≥=

⎟⎟⎠

⎞⎜⎜⎝

⎛ −≥=⎟⎟

⎞⎜⎜⎝

⎛≥

−=≥→≈

−→≈

−−

nn

n

PP

SnPSn

PPSnNX

χχ

σσσχ

σσμ

2a.- (PUNTS 1,5). Sigui una variable aleatòria X que es distribueix com una normal de paràmetres N(μ,σ). S’ha obtingut una mostra de mida n=9 de la qual s’ha extret que la mitjana és 39,11 i la quasi-variància és 49,61. Obtingui un interval de confiança per a un nivell de significació de α=0.05. La resolució, aparentment correcta, és la següent: Atès que la variable aleatòria es distribueix com una Normal, la distribució de la mitjana mostral

serà: ⎟⎠⎞

⎜⎝⎛≈

nNX σμ, . Per tant, l’interval de confiança és: ασμσ

αα −=⎟⎟⎠

⎞⎜⎜⎝

⎛+≤≤− 1

22 nZX

nZXP .

Així, en aquest cas específic, i substituint pels valors mostrals,

( )35,2*96,111,3935,2*96,111,3995,0304,796,111,39

304,796,111,39 +≤≤−→=⎟

⎠⎞

⎜⎝⎛ +≤≤− μμ PP . Per tant, l’interval de

confiança és: ( ) 95,071,4351,34 =≤≤μP . On està l’error de la resolució proposta?. Justifiqui la seva resposta i proposi l’interval de confiança correcte. L’error es troba en que no es coneix la variància poblacional. Atès que s’ha de d’utilitzar una estimació d’aquesta, si bé s’ha fet bé en substituir la variància poblacional per la mostral, no s’ha fet bé en fer servir la distribució normal, ja que en aquest cas s’ha d’utilitzar la t-student. Així

( ) 95,052,4470,33

95,0304,730601,211,39

304,730601,211,391

1,21,2

=≤≤

=⎟⎠⎞

⎜⎝⎛ +≤≤−→−=⎟⎟

⎞⎜⎜⎝

⎛+≤≤−

−−

μ

μαμ αα

P

PnStX

nStXP

nn

3a. (PUNTS 1). Sigui una mostra aleatòria simple extreta d’una població que es distribueix normalment amb paràmetres μ i σ. Es proposen els següents dos estimadors per al paràmetre poblacional μ. Obtingui el Biaix dels dos estimadors proposats.

( )22ˆˆ3

1 22

11 −⎟

⎞⎜⎝

⎛+== ∑ ∑∑

= −==

nXXnXn

i

n

niii

n

ii μμ

( ) { ( ) ( )( ) ( ) ( )

( ) ( ) { [ ]

( ) ( ) μμμμμμμμ

μμ

μμμμμμ

25

223

23ˆˆ

23

6)3(2

12222

12

0ˆˆ11ˆ

22

1231

3

1 22

11111

1

−=

−+/−+/=−

−+

=−=→−+

=

=+−−

=+++++−

=⎟⎟⎟⎟

⎜⎜⎜⎜

+=

=−=→=//

=+=⎟⎠⎞

⎜⎝⎛ ++

=⎟⎟⎟⎟

⎜⎜⎜⎜

=

−−−

= −=

=

∑ ∑

nnnn

nnEBIAIX

nn

nn

XXXXXEnn

XXEE

EBIAIXnn

XEXEnn

XXE

n

XEE

masnnnn

n

i

n

niii

nMAS

n

n

ii

L

LL

Page 2: 000 Eeie II Juny2011 Solucio

4a.- (PUNTS: 1,5). Segons el Pla Sísmic d’una de les comunitats autònomes, la distribució dels habitatges construïts després de 1970, en funció de l’alçada i de si aquest és urbà o rural, és la que es presenta a la Taula A. A la Taula B es faciliten les freqüències marginals d’aquesta informació. Es pot afirmar amb un nivell de significació del 5% que hi ha independència entre l’estructura (nombre de plantes) dels edificis i si l’edifici és urbà o rural? Realitzi el contrast corresponent i raoni els resultats obtinguts.

TAULA A TAULA B Data de Construcció: Després de 1970 Observacions en milers d’habitatges Freqüències Marginals Urbana Rural Total Urbana Rural Total

< 5 plantes 315 373 688 < 5 plantes 329,82 358,18 0,95 = 5 plantes 12 2 14 = 5 plantes 6,71 7,29 0,02

Alç

ada

> 5 plantes 22 4 26 Alç

ada

> 5 plantes 12,46 13,54 0,04 Total 349 379 728 Total 0,48 0,52 1

Contrast: ( ) ( ) ( ) 3,23

54,1354,134

82,32982329315 22

1 1

22

01

0 ≈−

++=−

=⎩⎨⎧ ∑∑

= =

L,-

EEn

HNoHciaIndependènH r

i

c

j ij

ijijχ

Raonament dels Resultats Obtinguts: L’estadístic del contrast dóna un valor de 23,3. Aquest estadístic es distribueix com una distribució

( )( ) 99,5295,0,2

21,11 ==−−− χχ αcr . Per tant, podem argumentar que les diferències entre les dades reals i les que

esperaríem en una situació d’independència són estadísticament significatives. Per tant, l’evidència mostral ens convida a pensar que refusem la hipòtesi nul·la d’independència entre els factors: Tipologia dels edificis i alçada dels edificis. 5a.-(PUNTS: 2). Un candidat a Alcalde que pretén reeditar el seu mandat vol demostrar que si l’oposició entra al govern del municipi (MUNICIPI A), baixarà la qualitat del transport públic per al ciutadà mitjà. L’equip tècnic de l’alcalde treu una mostra aleatòria de 100 ciutadans que fan servir el transport públic al MUNICIPI A, i una mostra aleatòria de 200 ciutadans d’una ciutat de característiques similars (MUNICIPI B) on governa el partit que fa d’oposició al municipi de l’Alcalde. A tots els individus seleccionats se’ls hi pregunta si consideren que el tiquet de transport públic és massa car per al servei prestat al seu municipi. En el cas del municipi de l’Alcalde (MUNICIPI A) 66 ciutadans contesten que és massa car. En el cas del municipi governat per l’altre partit polític (MUNICIPI B) 145 contesten que és massa car. Pot defensar l’Alcalde, estadísticament, la seva afirmació? Estructura algebraica del contrast: Estadístic del Contrast

( ) ( )

( )0

1

0

ˆ1ˆ

0RHZ

NNNNPP

PSIHH

BA

BA

BA

AB

AB →=

⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

−≤

−+

−−

⎩⎨⎧

<=

αππ

ππππ

α

-1,16

Tot i aquesta errata de l’enunciat, (-0,16 a l’original, front al -1,16), degut a que es van corregir les errates a aquest document, però no es van transferir al fotocopiat i es va lliurat a l’aula el dia de la prova, els resultats són exactament els mateixos i no altera la resolució proposada. Malgrat però, aquesta incidència s’ha tingut present quan s’ha fet la correcció, considerant totes dues possibilitats. Proposi expressió algebraica i resultat numèric de l’estimador de π?

7,0300211

20010014566ˆ ==++

=++

=BA

BA

NNnn

π

Pot defensar l’Alcalde estadísticament la seva afirmació? (Raoni, estadísticament, la seva resposta) Evidentment, si l’Alcalde pot o no defensar estadísticament aquesta afirmació, dependrà del nivell de significació amb el que treballem. Si suposem els tres nivells de significació habituals: 0.01, 0.05 0.10 i

Page 3: 000 Eeie II Juny2011 Solucio

mirem el valor de taules a la normal que acumula aquestes probabilitats des de menys infinit trobem que aquest punts són, respectivament: -2,3; -1,64 ; -1,28. Per tant, en tots tres casos el nostre estadístic queda a la dreta del valor en taules (Regió d’acceptació) i, per tant, no es pot refusar la hipòtesi nul·la i, en conseqüència, l’Alcalde l’únic que pot mantenir es que el servei no és millor a municipis on governa l’oposició. 6a.- (PUNTS: 2). A partir de l’estimació del següent model de regressió, resolgui les qüestions que se li plantegen a continuació: Treballi amb un nivell de significació de α=0,05 a) Especifiqui el model de regressió poblacional que del que s’ha realitzat aquesta estimació.

Valori si són significativament diferents de zero les estimacions MQO dels paràmetres de la recta de regressió poblacional. Valori si el model és significatiu conjuntament. (Raoni les seves respostes).

El model de regressió poblacional que s’ha estimat és el següent:

iedatconstsalari εβ ++= * Per a valorar un si es refusa un estadístic d’un contrast amb un output d’un paquet estadístic només necessitem conèixer l’estructura de les hipòtesis nul·la i alternativa. Si, en aquest cas, el Valor p és inferior al nivell de significació amb el que treballem, vol dir que es refusa la hipòtesi nul·la, atès que l’estadístic es troba a la regió crítica. En aquest cas els tres Valors p, tant el associat a la constant (const), com l’associat al pendent (edat), com l’associat a l’estadístic se significació conjunt (F(1,38)), presenten valors clarament inferiors a 0,05. En conseqüència, en el cas dels tres tests estadístics:

⎩⎨⎧

>=

⎩⎨⎧

≠=

⎩⎨⎧

≠=

00

00

00

21

20

1

0

1

0

RHRH

iHH

HH

ββ

αα

Es refusa la hipòtesi nul·la en els tres casos. Per tant, amb un 5% de significació, els paràmetres poblacionals dels models són significativament diferents de zero i el model, en conjunt, és significatiu. b) Construeixi l’interval de confiança per al paràmetre poblacional β tenint present el nivell de

significació assignat. Interpreti els resultats obtinguts de l’interval de confiança. Estructura algebraica de l’interval:

[ ] ασββσβ ββ αα −=+≤≤− −− 1ˆˆˆˆˆ2,ˆ2, 22 nn ttP

Estructura numèrica de l’interval: [ ] 95,003041,0*02,21764,103041,0*02,21764,1 =+≤≤− βP

A les taules de la t-student no apareix la t(38), però no existeix cap problema en fer l’aproximació al valor més proper t(40). En els dos casos, arrodonint a dos decimals aquest valor és 2,02

Page 4: 000 Eeie II Juny2011 Solucio

Resultat numèric de l’interval:

[ ] 95,0238,1115,1 =≤≤ βP Interpretació dels resultats numèrics de l’interval: Aquests resultats ens indiquen que si podéssim fer rèpliques del procés de mostreig de les variables que s’han introduït en el procés d’estimació, podem garantir que en el 95% dels casos el paràmetre poblacional es trobaria entre 1,115 i 1,238, malgrat però, hi hauria un 5% dels casos que el paràmetre no es trobaria dins aquest interval. 7a.- (PUNTS: 1). S’ha realitzat un contrast de Shapiro-Wilk i de Ratxes sobre la variable “resid”. Ens han dit que la variable “resid” és un mostra aleatòria d’una població amb distribució de forma i paràmetres desconeguts. Amb un 2% de significació:

a) Es pot sostenir que la variable resid pot procedir d’una variable aleatòria que segueix una distribució normal?

b) Es pot afirmar que la mostra extreta és, realment, aleatòria?

c) A quina conclusió arriba de la interpretació conjunta dels dos estadístics

(Raoni les seves respostes)

a) En el cas del contrast de normalitat de la variable resid, s’està plantejant la següent estructura de contrast:

⎩⎨⎧

01

0

HNoHNormalitatH

Atès que l’estadístic del contrast W deixa una cua de 0,0375 i el nostre nivell de significació (0,02) és més petit que el P-Value, l’estadístic del contrast es troba a la regió d’acceptació i, en conseqüència, no refusem la Hipòtesi nul·la de Normalitat de la variable resid. b) Respecte al de ratxes d’aleatorietat, aquest presenta la següent estructura:

⎩⎨⎧

01

0

HNoHAleatoriaMostraH

Atès que en aquest cas, com que l’estadístic del contrast deixa un p-value de 0,05289, clarament superior al nostre nivell de significació 0,02, no podem refusar la hipòtesi nul·la d’aleatorietat de la mostra. c) La interpretació conjunta ens indica no només la variable resid és una mostra aleatòria, sinó que a més a més, és plausible suposar que procedeix d’una població que segueix una distribució normal.

Page 5: 000 Eeie II Juny2011 Solucio

ESTADÍSTICA ECONÒMICA I EMPRESARIAL II (PART AV. ÚNICA) JUNY 2011 NOM i COGNOMS: NIUB: 1a.- (2 PUNT).- Una empresa farmacèutica desitja saber si els efectes secundaris de tres medicaments de la grip s’eliminen en termes mitjans al mateix temps. Es pot suposa que la durada dels efectes secundaris dels tres medicaments es distribueix com una normal amb esperança desconeguda i amb variàncies desconegudes però iguals. Al quadre següent es recull informació de tres mostres aleatòries escollides per l'estudi. Amb un nivell de significació del 5%, es afirmar que el temps d’eliminació dels efectes secundaris és igual en els tres casos? (Raoni els seus resultats)

M1 M2 M3 8,2 7,9 9 12 8,4 7,9 9,4 8,4 8,4 10,2 9 9 8,7 14 10

48,5 47,7 44,3

8,88 25,47 2,47

De la informació de la taula podem obtenir els següents resultats:

2ª.- (1 PUNT) Des de la conselleria d'Educació es vol conèixer si el fracàs escolar és el mateix a les zones rurals que a les zones urbanes. S'extreu una mostra de 250 alumnes de l'àmbit rural i s'observa que 75 no han superar l’ESO. De 500 alumnes a l'àmbit urbà, 200 alumnes no han superat la educació secundaria obligatòria. a) Calculi l'interval de confiança al 95% i comprovi si es pot concloure o no si hi ha diferencies en el fracàs escolar rural i urbà. b) Sense fer cap càlcul, com creu que canviaria l'interval de l'apartat anterior si el nivell de confiança es del 99%? (mantenint-se constant la resta de la informació). Raoni la seva resposta. es del 99%? (mantenint-se constant la resta de la informació). Raoni la seva resposta.

a) Si aleshores . En el nostre cas, això es compleix,

1000*0.53(1-0.53)>5. Per tant,

b) Si augmentem la confiança l' interval augmenta, donat que per obtenir més encerts em de fer més gran el nostre interval.