6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi...

31
BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea 1 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana GAITASUNAK Gai hau bukatzean ikaslea gai izango da: - Batezbestekoaren estimazioa biztanlerian kalkulatzeko. - Proba parametrikoak erabiltzeko baldintzak aplikatzeko. - Student-en t proba parametrikoa erabiltzeko baldintzak aplikatzeko eta probaren emaitzak interpretatzeko. - Bariantzaren analisia proba parametrikoa erabiltzeko baldintzak aplikatzeko eta probaren emaitzak interpretatzeko. - Mann Whitney-ren proba EZ-parametrikoa erabiltzeko baldintzak aplikatzeko eta probaren emaitzak interpretatzeko. - Krusskall Wallis-en proba EZ-parametrikoa erabiltzeko baldintzak aplikatzeko eta probaren emaitzak interpretatzeko. - Normaltasuna. Kolmogoroff Smirnoff - Homozedastizitatea. Levene. - Student-en t. Mann Wathney-n U - ANOVA.. Krusskall Wallis. 0. Sarrera Aldagai kualitatibo baten artean eta aldagai kuantitatibo baten artean harremana dagoen ikusteko, aldagai kuantitatiboak aldagai kualitatiboaren kategoria ezberdinetan dituen batezbestekoak hartuko ditugu kontuan. Biztanleria osoa ikasten ez dugunez, lagina baizik, gure lagineko batezbestekotik abiatu eta inferentzia egingo dugu biztanleriako batezbestekoak kalkulatzeko (beti ere asmatzeko probabilitate batekin). Bi aldagaien artean harremana ez badago (hipotesi nulua), biztanleriako batezbesteko horiek berdinak izango dira. Bi aldagaien artean harremana badago, biztanleriako batezbesteko horiek ez dira berdinak izango.

Transcript of 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi...

Page 1: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

1

6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana

GAITASUNAK

Gai hau bukatzean ikaslea gai izango da:

- Batezbestekoaren estimazioa biztanlerian kalkulatzeko. - Proba parametrikoak erabiltzeko baldintzak aplikatzeko. - Student-en t proba parametrikoa erabiltzeko baldintzak aplikatzeko eta probaren emaitzak interpretatzeko. - Bariantzaren analisia proba parametrikoa erabiltzeko baldintzak aplikatzeko eta probaren emaitzak interpretatzeko. - Mann Whitney-ren proba EZ-parametrikoa erabiltzeko baldintzak aplikatzeko eta probaren emaitzak interpretatzeko. - Krusskall Wallis-en proba EZ-parametrikoa erabiltzeko baldintzak aplikatzeko eta probaren emaitzak interpretatzeko.

- Normaltasuna. Kolmogoroff Smirnoff

- Homozedastizitatea. Levene.

- Student-en t. Mann Wathney-n U

- ANOVA.. Krusskall Wallis.

0. Sarrera

Aldagai kualitatibo baten artean eta aldagai kuantitatibo baten artean harremana dagoen ikusteko, aldagai kuantitatiboak aldagai kualitatiboaren kategoria ezberdinetan dituen batezbestekoak hartuko ditugu kontuan. Biztanleria osoa ikasten ez dugunez, lagina baizik, gure lagineko batezbestekotik abiatu eta inferentzia egingo dugu biztanleriako batezbestekoak kalkulatzeko (beti ere asmatzeko probabilitate batekin). Bi aldagaien artean harremana ez badago (hipotesi nulua), biztanleriako batezbesteko horiek berdinak izango dira. Bi aldagaien artean harremana badago, biztanleriako batezbesteko horiek ez dira berdinak izango.

Page 2: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

2

Adibidez:

Susmoa: mutilak neskak baino altuagoak dira

Hipotesia: harremana dago sexuaren eta altueraren artean

Hipotesi nulua: ez dago harremanik sexua eta altueraren artean.

Hipotesi nulu estatistikoa: µ♂=µ♀

µ♂=mutilen altueraren batezbestekoa biztanlerian

µ♀=nesken altueraren batezbestekoa biztanlerian

Biztanlerian berdina da mutilen eta nesken altueraren batezbestekoa.

Pentsatu pixka bat, altura eta sexuaren artean harremanik ez badago, mutilek eta neskek berdintsu neurtuko dute, eta harremana badago, ezberdin neurtuko dute. Ez da ala?

Inferentzia egin beharra dago, gure ikerketan lagina bakarrik ikasi dugulako.

Demagun Donostiako helduen (>18 urte) lagin adierazgarri bat hartu dugula eta altuera neurtu diegula (lagina osatzen zuten denei), horretarako baliagarriak diren tresnarekin eta prozedurarekin. Emaitza hauek lortu ditugu:

Altueraren batezbestekoa (m), desbideraketa tipikoa (s) eta batezbestekoaren akats estandarra (δm):

Mutilak: m♂:170zm, s♂: 10zm; δm♂: 1zm

Neskak: m♂160zm; s♀: 10zm; δm♀: 1zm

Hori gure ikerketako emaitzak dira, gure laginekoak. Azken lagina baliagarria denez, gure biztanleriako altueraren batezbestekoa kalkula dezakegu (inferitu dezakegu), hori bai, beti asmatzeko probabilitate batekin (hori da biztanleria osoa ez ikertzeak eskatzen duen prezioa). Ikerketan onartua dago asmatzeko %95eko probabilitatea (huts egiteko %5eko probabilitatea). Asmatzeko %95eko probabilitateari t=2 dagokio (1,96). Beraz goazen biztanleriako altueraren batezbestekoak inferitzera:

µ=m+t δm

Mutilena: 170+2, hau da, 168 eta 172 zentimetroen artean.

Neskena: 160+2, hau da, 158 eta 162 zentimetroen artean.

Hau da, asmatzeko %95eko probabilitatearekin, mutilen altueraren batezbestekoa biztanlerian 168-172 zentimetroen artean dago eta nesken altueraren batezbestekoa biztanlerian 158-162 zentimetroen artean,

� hau da, mutil eta nesken altueraren batezbestekoa biztanlerian ez da berdina (asmatzeko %95eko probabilitatearekin)

� hau da, harremana dago sexuaren eta altueraren artean

Hori da guk “eskuz” egiteko dakigun modua.

Page 3: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

3

Halere, gaur egun, programa informatikoak erabiliz hainbat proba estatistiko erabili ditzakegu. Proba estatistikoek hipotesi nuluaren probabilitatea kalkulatzen digute zuzenean. Probabilitate hori %5ekoa baino txikiagoa bada (p<0,05), bi aldagaien artean harremana dagoela frogatu dugu.

Aldagai bat kuantitatiboa denean eta bestea kualitatiboa, hainbat proba estatistiko erabili daitezke, hiru baldintzen arabera: - Zenbat kategoriatan banatzen da aldagai kualitatiboa. - Normaltasuna - Homozedastizitatea.

Aldagai kualitatiboak izan ditzake: - 2 kategoria. Orduan erabiliko dugu “Student-en t” edo “Mann Whitney-n U”. - 2 kategoria baino gehiago: “Bariantzaren analisia” (ANOVA) edo “Krusskall Wallis”.

Aipatutako lau proben artean, batzuk parametrikoak dira (“Student-en t” eta “ANOVA”) eta besteak ez parametrikoak dira (Mann Whitneyn U” eta “Krusskall Wallis”).

Proba parametrikoak “indartsuagoak” dira eta informazio gehiago lortzen laguntzen digute. Halere, “exigenteagoak” direla esaten da, hau da, erabili ahal izateko baldintzak eskatzen dituzte. Bi dira erabili ahal izateko eskatzen diren baldintzak: - Normaltasuna. - Homozedastizitatea.

Ez badira biak betetzen, ezingo dugu proba parametrikorik erabili eta orduan dagokion proba ez-parametrikoa erabiliko dugu.

- Normaltasuna:

Baldintza hau bete dadin, aldagai kuantitatiboa normalki banatuko da aldagai kualitatiboaren kategoria ezberdinetan. Aldagai kualitatiboak bi kategoria baditu, kategoria bakoitzaren histograma eraikiko dugu aldagai kuantitatiboarekin eta ikusiko dugu normalki banatzen den aldagai kuantitatiboa bi banaketa horietan. Aldagai kualitatiboak hiru kategoria baditu, hiru banaketak normalki banatzen diren ikusiko dugu. Normaltasunaren baldintza betetzen da, aldagai kualitatiboaren kategoria guztietan, banaketa normala bada.

- Homozedastizitatea

Aldagai kualitatiboaren kategoria ezberdinetan eginiko banaketa ezberdinek bariantza berdintsua izatean datza.

Page 4: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

4

Adibidez:

EHUko ikasle gazteen (18-25 urte) lagin adierazgarri bati (N:5155) kanporakoitasuna neurtu zitzaion (1993-94 ikasturtean), horretarakoa baliagarria den test bat (Eysenck Personality Inventory) era baliagarri batean pasatuz.

Kanporakoitasuna nortasunaren ezaugarri bat da, barnerakoia izatearen aurkakoa: kanporakoiak besteekin egotea bilatzen du, harremanak egitea. Gazteleraz extraversión deritzo kanporakoitasunari.

Emaitzak:

m me mo b s δm N mutilak 11,5 12 12 15,21 3,9 0,08 2276 neskak 11,1 11 12 14,44 3,8 0,07 2879

Ze proba estatistiko erabili jakiteko, normaltasunaren eta homozedastizitatearen baldintzak betetzen diren ikusiko dugu aurrena.

- Normaltasunaren baldintza betetzen da? Aldagai kuantitatiboa normalki banatzen da aldagai kualitatiboaren kategorietan? Hau da, mutilen eta nesken kanporakoitasunaren banaketak, normalak dira? Bai, bi banaketak normalak dira, beraz normaltasunaren baldintza betetzen da.

Kanporakoitasuna aldagaia normalki banatzen da mutilen artean?

Kanporakoitasuna aldagaia normalki banatzen da nesken artean?

- Homozedastizitatearen baldintza betetzen da? Hau da, banaketa horien bariantzak berdintsuak dira? Badirudi bariantzak berdintsuak direla (mutilena 15,21 eta neskena 14,44). Halere, horretarako Levenen proba erabiltzen da. Proba horren hipotesi nulua bariantzak berdintsuak direla da, beraz hipotesi nuluaren probabiliatea %5 baino handiagoa den bitartean (p>0,05) bariantzak berdintsuak direla ondoriozta dezakegu. Gure kasuan hipotesi nuluaren probabilitatea 0,438 da, beraz bi bariantzak berdintsuak direla ondoriozta dezakegu.

-

Bi baldintzak bete direnez, proba parametrikoa erabili dezakegu, eta aldagai kualitatiboak bi kategoría dituenez, Studenten t proba erabiliko dugu

EXTROVERSION

2321191715131197531

EXTROVERSION

Fre

cue

ncia

300

200

100

0

Desv. típ. = 3,83

Media = 11

N = 2879,00

EXTROVERSION

2321191715131197531

EXTROVERSION

Fre

cue

nci

a

300

200

100

0

Desv. típ. = 3,86

Media = 12

N = 2276,00

Page 5: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

5

Beraz, egin beharrekoa zera da:

- Aurrena, aldagai kualitatiboaren kategoria guztietan, aldagai kuantitatiboaren banaketa egin (maiztasun histograma).

- Bigarrena, banaketa horiek normalki banatzen diren ikusi.

- Hirugarrena, banaketa normal horiek bariantza berdintsua duten ikusi

Normaltasuna eta homozedastizitatea ikusteko proba estatistiko bereziak daude:

- Normaltasuna: Kolmogoroff Smirnoff-en proba.

- Homozedastizitatea: Levene-n proba.

Proba horien hipotesi nuluak:

- Kolmogoroff Smirnoff-en proba: banaketa normala da. Ez dugu ikusiko.

- Levene-n proba: bariantzak berdintsuak dira.

Normaltasunaren proba bat egingo dugu aldagai kualitatiboaren kategoria bakoitzarentzat. Leven-en proba bakarra egingo dugu banaketa guztien bariantzak berdintsuak diren ikusteko.

Hipotesi nuluaren probabilitatea Kolmogoroff Smirnoff-en proban:

p>0,05: normalki banatzen da.

P<0,05: banaketa ez da normala.

Hipotesi nuluaren probabilitatea Leven-en proban::

p>0,05: banaketen bariantzak berdintsuak dira.

P<0,05 : banaketen bariantzak ez dira berdintsuak.

Page 6: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

6

Adb:

Bi aldagaien artean harremana dagoen ikusi nahi dugu. Aldagai bat pisua da (kuantitatiboa jarraia, arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala nominalean neurtua: 0 Afrika, 1 Amerika, 2 Asia, 3 Ozeania, eta 4 Europa).

Aurrena, pisuaren banaketa egingo dugu kontinente bakoitzarentzat eta ikusiko dugu:

- Bost banaketak normalak diren (normaltasun proba)

- Bost banaketa horien bariantzak berdintsuak diren.(homozedastizitatearen proba).

Bi baldintzak betetzen badira, ANOVA proba erabiliko dugu. Bi baldintzetatik gutxienez bat betetzen ez bada, Krusskall Wallis-en proba erabiliko dugu. Bi baldintzak bete behar dira ANOVA erabiltzeko. Bost banaketetatik bat bakarrik normalki ez banatzea, nahikoa da ANOVA ez erabiltzeko.

Laburtuz:

Kualitatiboaren kategoriak Proba parametrikoak Proba ez-parametrikoak

2 Student-en t

Ho: µ1=µ2µ1=µ2µ1=µ2µ1=µ2

Man Witney-n U

>2

ANOVA (Bariantzaren analisia)

Ho: µ1=µ1=µ1=µ1=µ2=µ3=...µ2=µ3=...µ2=µ3=...µ2=µ3=... Krusskall Wallis

Page 7: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

7

1. Student-en t proba.

Baldintzak:

- Aldagai kualitatiboak bi kategoria izatea

- Aldagai kuantitatiboa aldagai kualitatiboaren bi kategoriatan normalki banatzea.

- Aldagai kuantitatiboaren bi banaketek bariantza berdintsuak izatea. Baldintza hau ez da ezinbestekoa, Student-en probak zuzenketa berezia baitauka kasu horietan erabiltzeko.

“Student-en t” proban, bi bariantzak berdintsuak ez badira, zuzenketa bat egiten du eta beraz “Student-en t proba zuzendua” erabili daiteke. Bi banaketak ez badira normalki banatzen, ezin da “Student-en t” proba erabili eta “Mann Wathney-n U” proba erabili beharko dugu.

Hipotesi nulua: ez dago harremanik bi aldagaien artean

Hipotesi nulu matematikoa: Ho: µ1=µ2 µ1=µ2 µ1=µ2 µ1=µ2

Hori beti bezala bi eratara egin daiteke:

1- Era tradizionala: Gure laginean aldagai kualitatiboaren bi kategoriek bi azpitalde osatzen dituzte. Bakoitzak bere banaketa du aldagai kuantitatiboaren balioekin eta banaketa bakoitzak bere batezbestekoa du (m1 eta m2). Ikusi behar dena zera

da, µ1−µ1−µ1−µ1−en eta µ2µ2µ2µ2 ren balioak (konfidantza tarte jakin batentzat), hau da biztanleriako batezbestekoak, ukitzen diren ala ez. Ez badira ukitzen, bi batezbestekoak ezberdinak dira biztanlerian eta beraz, bi aldagaien artean harremana frogatu da. Biztanleriako bi batezbestekoak ukitzen badira, ez dago harremanik bi aldagaien artean.

µ1 = m1 + t δm1

µ2 = m2 + t δm2

Page 8: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

8

Adibidea:

Hipotesia: Helduaroan, sexuaren artean eta pisuaren artean harremana dago.

Hipotesi nulua: Helduaroan ez dago harremanik sexuaren eta pisuaren artean

Hipotesi nulu matematikoa. µµµµ♀=µ=µ=µ=µ♂

Biztanleriako helduen pisuaren batezbestekoa berdina da gizonezkoen artean eta emakumeen artean:

µ♀= Pisuaren batezbestekoa biztanleriako emakume helduen artean

µ♂= Pisuaren batezbestekoa biztanleriako gizon helduen artean

Laginaren emaitzak

Sexua Pisuaren batezbestekoa s δδδδ

Emakumea 56,6 6,5 0,6 Gizona 71,7 8,8 1,1

Laginean argi dago gizon eta emakumeen pisua ez dela berdina, harremana dagoela sexua eta pisuaren artean. Eta biztanlerian? Biztanlerian harremana dago sexua eta pisuaren artean?

Horretarako %95eko konfiantza tarteak defini ditzakegu:

- µ♀= m1♀ + t δm1♀ = 56,6 + 2 . 0,6 = 56,6 + 1,2 = (55,4---- 57,8).

- µ♂= m♂ + t δm♂ = 71,7 + 2 . 1,1 = 71,7 + 2,2 = (69,5- --73,9).

Biztanleriarako egindako inferentzia horiek, %95eko konfidantza tartea dira (asmatzeko %95eko probabilitatea, huts egiteko %5eko probabilitatea). Beraz, bi konfidantza tarte horiek ez badira ukitzen esan dezakegu berdinak izateko probabilitatea %5ekoa baino txikiagoa dela (oso txikia) beraz hipotesi nulua baztertu egingo dugu.

Asmatzeko %95eko probabilitatearekin frogatu dugu helduen artean, sexuaren eta pisuaren artean harremana dagoela biztanlerian.

2- Ordenagailuari hipotesi nuluaren probabilitatea eskatuz Probabilitate hori 0,05 baino txikiagoa bada, hipotesi nulua baztertzen dut. Horrek esan nahi du, bi aldagaien artean harremana dagoela (gutxienez asmatzeko %95eko probabilitatearekin).

Aurrena baldintzak aztertuko genituzke:

1: Aldagai kualitatiboak bi kategoria ditu (gizona eta emakumea)

Page 9: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

9

2. Aldagai kuantitatiboa normalki banatzen da aldagai kualitatiboaren kategorietan? Hau da, mutilen pisuaren banaketa normala da? Eta nesken pisuaren banaketa normala da?

3. Pisuaren banaketak nesken eta mutilen taldean, bariantza berdintsuak ditu?

Student-en t erabiltzeko bi baldintza bete behar dira:

- Pisuaren banaketa gizonengan eta emakumeengan normala izatea (kolmogoroff Smirnoff frogaren bidez jakin dezakegu). Baita ere maiztasun histogramak ikusita, m,mo eta me berdintsuak diren ikusita eta s eta m begiratuta.

- Pisuaren banaketak gizonezkoengan eta emakumezkoengan bariantza berdintsuak ditu. Hori Leven-en frogaren bidez jakin dezakegu. Student-en t frogak Levenen froga egin eta gainera, bariantzak berdin direnen kasuarentzat eta ezberdinak diren kasuarentzat, t kalkulatu eta hipotesi nuluaren probabilitatea kalkulatzen digu.

Gure kasuan pisua normalki banatzen da gizonengan eta emakumeengan.

Leven-en frogari begiratzen badiogu, ondoriozta dezakegu bi bariantzak berdintsuak direla. Leven-en frogaren hipotesi nulua da: bariantza berdinak dituzte pisuaren banaketek: gizonengan eta emakumeengan.

Hipotesi nuluaren probabilitatea 0,05 baino handiago denez (0,098), ezin dugu hipotesi nulu hori baztertu. Beraz, ondorioa: bi banaketen bariantzak berdintsuak dira.

Beraz Student-en t proba erabili dezakegu.

Page 10: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

10

Stduent-en t probaren emaitzak

Gure adibidean: lehenengo taulan estatistiko deskribatzaileak ikusten ditugu, eta bigarrenean Student-en t proba.

Taula honetan ikus daiteke nesken (sexua 0) batezbestekoa (56,6), desbideraketa tipikoa (6,5) eta batezbestekoaren akatsa estandarra (0,6). Bigarren ilaran mutilen emaitzak daude (sexua 1) (60 mutil daude, batezbestekoa (71,7), desbideraketa tipikoa (8,8) eta batezbestekoaren akatsa estandarra (1,1).

Froga estatistikoa ikusten badugu, Student-en t arentzat bi balio ditugu: bat bariantzak berdinak badira eta bestea ezberdinak badira.

Kasu hauetan, bariantza berdintsuak, lehenengo lerroko emaitzak begiratuko ditugu. t-ren balioa -12,494 eta t horri dagokion probabilitatea 0,000. Hau 0,05 baino txikiagoa da, beraz, hipotesi nulua baztertu egingo dugu.

Ondorioa: Biztanlerian harremana dago sexuaren artean eta pisuaren artean.

Bi bariantzak ez balira berdintsuak, bigarren lerroko emaitzetan begiratuko genuke (Student-en t proba zuzendua, bariantza ezberdinak direnean erabiltzen den zuzenketa).

Page 11: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

11

2. Mann Whitney-n U proba.

Noiz erabiltzen da?

Student-en t proba ezin denean erabili:

- Aldagai kualitatiboaren kategoria batean edo bietan, aldagai kuantitatiboa ez denean normalki banatzen.

Hipotesi nulua: ez dago harremanik bi aldagaien artean

Kasu honetan ez dugu hipotesi nuluaren adierazpen matematikorik ikusiko eta hipotesi nuluaren probabilitatea ordenagailuz bakarrik kalkulatzen ikasiko dugu.

P<0,05 harremana dago biztanlerian bi aldagaien artean.

p>0,05 ez.

Hipotesia: Harremana dago edandako alkohol kopuruaren artean eta sexuaren artean.

Edandako alkohol kopurua ez da normalki banatzen ez gizonezkoen artean eta ez emakumezkoen artean, beraz ezin da Student-en t froga erabili. Horren ordez Mann Whitney-n U froga erabiliko da. Honek botatzen duen hipotesi nulua ez da batezbestekoen berdintasunena. Ez gara hemen luzatuko. Oraingoz nahikoa da interpretazioa berdin egiten dela esatearekin.

Ikus daiteke, p=0,000 (0,05 baino txikiagoa) beraz, biztanlerian ere harremana dago sexuaren artean eta edandako alkohol kopuruaren artean.

Page 12: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

12

Adibideak:

Susmoa: Unibertsitateko ikasleen artean, neskak beranduago hasten dira edaten eta gutxiago edaten dute.

Biztanleria: Euskal Herriko Unibertsitateko ikasleak, 1993. abendua

Lagina: EHUko fakultate bakoitzetik, zoriz ikasleen %10 aukeratzen da.

Partehartzea: %99

Neurketa: Ikasle horiei inkesta anonimo bat pasatzen zaie.

Hiru aldagai biltzen dira:

- Sexua: SEXUA o 0 Emakumea o 1 Gizona

- Alkohola lehenengoz probatu zuenean zuen adina (urteetan) ADINA - Inkestaren aurreko astean edandako alkohol kopurua (gramotan) ALKOHOLA ASTEAN

Galderak:

- Aldagaiak nolakoak dira eta zein eskalatan daude neurtuta? - Laginketa nolakoa da? - Ikerketak barne baliagarritasuna dauka? Zergatik? - Idatzi hipotesia eta hipotesi nulua. - Ze proba estatistiko erabiliko zenuke? Zergatik? - Idatzi hipotesi nulu estatistikoa - Harreman frogatu da bi aldagaien artean? Zergatik?

Aldagaiak: SEXUA: aldagai kualitatibo dikotomikoa, eskala nominalean neurtua. ADINA urteetan: aldagai kuantitatibo jarraia, arrazoi eskalan neurtua. ALKOHOLA ASTEAN gramotan: aldagai kuantitatibo jarraia, arrazoi eskalan neurtua. Laginketa Zorizkoa, bakuna, fakultateetatik geruzatua. Barne baliagarritasuna? Bai:

- Azken lagina baliagarria delako: lagina adierazgarria+partehartzea handia (%99).

- Neurketa baliagarria delako: neurgailuak baliagarriak eta neurketa prozesua baliagarria.

- Diseinua baliagarria delako: harremana frogatzeko nahikoa ikerketa epidemiologikoa zeharkakoa.

Hipotesiak: bi daude. Ikusi aurrerago

Page 13: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

13

Sexuaren eta alkohola probatutako adinaren artean harremana dagoen ikusteko probak. 1. Irudia. Euskal Herriko Unibertsitateko ikasle mutilen artean “Alkohola probatutako adina” aldagaiaren banaketa (1993. abendua)

2. Irudia. Euskal Herriko Unibertsitateko ikasle nesken artean “Alkohola probatutako adina” aldagaiaren banaketa (1993. abendua)

Prueba T Student

Prueba de Mann-Whitney

Page 14: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

14

- Idatzi hipotesia eta hipotesi nulua. - Ze proba estatistiko erabiliko zenuke? Zergatik? - Idatzi hipotesi nulu estatistikoa - Harreman frogatu da bi aldagaien artean? Zergatik?

Hipotesia: Harremana dago sexuaren artean eta edaten hasitako adinaren artean. Hipotesi nulua: Ez dago harremanik sexuaren artean eta edaten hasitako adinaren artean. Ze proba estatistiko erabiliko zenuke? Aldagai bat kualitatibo dikotomikoa denez eta bestea kuantitatiboa, lehenengo aukera Student-en t izango da. Proba hori erabiltzeko bi baldintzak betetzen badira, Student-en t proba erabiliko dugu:

- Aldagai kualitatiboaren bi kategoriatan aldagai kuantitatiboa normalki banatzen da: bai mutilen kasuan eta bai nesken kasuan, edaten hasitako adina aldagaia normalki banatzen da. Normaltasunaren baldintza betetzen da.

- Aldagai kualitatiboaren bi kategoriatan, aldagai kuantitatiboaren bi banaketek bariantza berdintsua dute. Hori Leven-en proban ikusten da. Leven-en probaren hipotesi nuluak dio: bi bariantzak berdintsuak dira. Hipotesi nulo horren probabilitatea oso txikia denez, baztertu egingo da hipotesi nulua. Beraz, bi bariantzak ez dira berdintsuak. Homozedastizitatearen baldintza ez da betetzen. Kasu honetan Student-en proba zuzenduan begiratu beharko genuke.

Hipotesi nulu estatistikoa: Ηο: µ♀=µ♂ Euskal Herriko Unibertsitateko ikasleen artean, edaten hasitako adinaren batezbestekoa, berdina da gizonen artean eta emakumeen artean: µ♀= Edaten hasitako adinaren batezbestekoa EHUko ikasle nesken artean. µ♂= Edaten hasitako adinaren batezbestekoa EHUko ikasle mutilen artean.

Harreman frogatu da bi aldagaien artean? Zergatik?

Bai.Hipotesi nuluaren probabilitatea 0,05 (%5) baino txikiagoa delako. Hipotesi nuluaren probabilitate hori Student-ek kalkulatzen du. Bariantzak berdintsuak badira lehenengo ilaran begiratzen da taulan (Se han asumido varianzas iguales), bestela bigarren ilaran (No se han asumido varianzas iguales). Gure kasuan bigarren ilaran begiratu behar dugu.

Ondorioa: EHUko ikasleen artean sexuaren artean eta edaten hasitako adinaren artean harremana dagoela ikusi da. Neskak beranduxeago hasten dira edaten (neskak 15,7-15,8 urte artean eta mutilak 15,4-15,5 urte artean, asmatzeko %95eko probabilitatearekin)

Page 15: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

15

Sexuaren eta edandako alkohol kopuruaren artean harremana dagoen ikusteko probak. 1. Irudia. Euskal Herriko Unibertsitateko ikasle mutilen artean “Edandako alkohol kopurua” aldagaiaren banaketa (1993. abendua)

2. Irudia. Euskal Herriko Unibertsitateko ikasle nesken artean “Edandako alkohol kopurua” aldagaiaren banaketa (1993. abendua)

Prueba T Student

Prueba de Mann-Whitney

Page 16: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

16

- Idatzi hipotesia eta hipotesi nulua. - Ze proba estatistiko erabiliko zenuke? Zergatik? - Idatzi hipotesi nulu estatistikoa - Harreman frogatu da bi aldagaien artean? Zergatik?

Hipotesia: Harremana dago sexuaren artean eta edandako alkohol kopuruaren artean. Hipotesi nulua: Ez dago harremanik sexuaren artean eta edandako alkohol kopuruaren artean. Ze proba estatistiko erabiliko zenuke? Aldagai bat kualitatibo dikotomikoa denez eta bestea kuantitatiboa, lehenengo aukera Student-en t izango da. Proba hori erabiltzeko bi baldintzak betetzen badira, Student-en t proba erabiliko dugu:

- Aldagai kualitatiboaren bi kategoriatan aldagai kuantitatiboa EZ DA normalki banatzen: ez mutilen kasuan ez eta nesken kasuan, edandako alkohol kopurua aldagaia ez da normalki banatzen. Normaltasunaren baldintza ez da betetzen. Beraz, ez dago bigarren baldintzari (homozedastizitateari) begiratu behar eta zuzenean Mann Whitney-ren proba erabiliko dugu.

Hipotesi nulu estatistikoa: Ho: ez dugu idatziko

Harreman frogatu da bi aldagaien artean? Zergatik?

Bai.Hipotesi nuluaren probabilitatea 0,05 (%5) baino txikiagoa delako.

Ondorioa: EHUko ikasleen artean sexuaren artean eta edandako alkohol kopuruaren artean harremana dagoela ikusi da.

Page 17: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

17

3.ANOVA: Analisys of Variance (Bariantzaren analisia).

Baldintzak:

1- Aldagai kualitatiboak bi kategoria baino gehiago izatea

2- Aldagai kuantitatiboa aldagai kualitatiboaren kategoria guztietan normalki banatzea.

3- Aldagai kuantitatiboaren banaketek bariantza berdintsuak izatea.

2. eta 3. baldintzak ez badira betetzen, proba ez parametriko bat erabili behar da (Krusskall Wallis adibidez) “ANOVA” proban, bariantzak berdintsuak ez badira, ez dago zuzenketarik Student-en proban bezala.

Hipotesi nulua: biztanlerian ez dago harremanik bi aldagaien artean

Hipotesi nulu matematikoa: Ho: µ1=µ2=µ3=... µ1=µ2=µ3=... µ1=µ2=µ3=... µ1=µ2=µ3=...

Hori beti bezala bi eratara egin daiteke:

1- Era tradizionala: Gure laginean, aldagai kualitatiboaren kategoria bakoitzak azpitalde bat osatzen du. Bakoitzak bere banaketa du aldagai kuantitatiboaren balioekin eta banaketa bakoitzak bere batezbestekoa du (m1, m2, m3...) Ikusi

behar dena zera da, µ1−µ1−µ1−µ1−en, , µ2−µ2−µ2−µ2−en ..eta µµµµn ren balioak (konfidantza tarte jakin batentzat), hau da biztanleriako batezbestekoak, ukitzen diren ala ez. Ez badira ukitzen, batezbestekoak ezberdinak dira biztanlerian eta beraz, bi aldagaien artean harremana dago. Biztanleriako batezbestekoak ukitzen badira, ez dago harremanik bi aldagaien artean.

µ1 = m1 + t δm1 µ2 = m2 + t δm2 µ3 = m3 + t δm3 ……………….. µn = mn + t δmn

Page 18: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

18

Adibidea

Hipotesia:

Harremana dago edateko maiztasunaren artean eta pisuaren artean. ALDAGAIAK :

EDALE PISUA 0. Abstemioa

1. Noizbehinkakoa

2. Ohiturazkoa

kualitatiboa politomikoa kuantitatiboa Eskala ordinalean

neurtua Arrazoi eskalan

neurtua

Hipotesi nulua: ez dago harremanik edateko maiztasunaren artean eta pisuaren artean.

Hipotesi nulu matematikoa: µµµµ0000=µ=µ=µ=µ1111=µ=µ=µ=µ2222

Biztanlerian pisuaren batezbestekoa berdina da edale talde ezberdinetan.

µ0= Pisuaren batezbestekoa biztanleriako abstemioen artean

µ1= Pisuaren batezbestekoa biztanleriako noizbehinkako edaleen artean

µ2= Pisuaren batezbestekoa biztanleriako ohiturazko edaleen artean

Lagineko batezbestekoa Biztanleriako batezbestekoa (%95)

Abstemioak 58,3 54,5-----------62 Noizbehinkakoak 62,4 60,5-------64,4

Ohiturazkoak 62,9 58,6---------------------67,2

Biztanlerian ordea, batezbestekoen konfidantza tarteak argi eta garbi ukitu egiten dira. Ezin dugu esan batezbestekoak berdinak ez direnik, beraz, ezin daiteke hipotesi nulua baztertu. Horrek esan nahi du ez dugula frogatu batezbestekoak biztanlerian ezberdinak direnik (h.d., biztanlerian ez da frogatu harremanik edateko ohituraren artean eta pisuaren artean.

Page 19: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

19

2- Ordenagailuari hipotesi nuluaren probabilitatea eskatuz Probabilitate hori 0,05 baino txikiagoa bada, hipotesi nulua baztertzen dut. Horrek esan nahi du, bi aldagaien artean harremana dagoela (asmatzeko gutxienez %95eko probabilitatearekin).

Gure adibidean:

taulan horretan kategoria bakoitzaren batezbestekoa, desbideraketa tipikoa eta batezbestekoaren akats estandarra azaltzen dizkigu. Horrez gain, kategoria bakoitzean %95eko konfidantza tartea.

Bigarren irteeran Leven-en proba egiten digu. Probabilitatea 0,05 baino handiagoa denez, hiru banaketen bariantzak berdintsuak direla esan dezakegu.

Azkeneko irteeran bariantzaren analisia azaltzen zaigu. Hipotesi nuluaren probabilitatea 0,05 baino handiagoa denez, ezin dugu hipotesi nulua baztertu, beraz ez dugu probatu bi aldagaien artean harremana dagoenik.

Page 20: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

20

ANOVA probak erabiltzen duen prozedura: berreduren batura.

Demagun hiru kategoria dituela aldagai kualitatiboak. Aldagai kuantitatiboaren lau batezbesteko kalkula ditzakegu: orokorra eta kategoria bakoitzekoa. Prozedura honetan alde batetik taldeen arteko berreduren batura egiten da eta bestetik talde-barneko berreduren batura.

Taldeen arteko berreduren baturaren batazbestekoa: kalkulatzen da talde bakoitzeko batezbestekotik batezbesteko orokorrera dagoen "distantzia" eta berredura egiten da. Gero dena batu eta askatasun graduengatik zatitzen da (kategoria kopurua-1).

Talde-barneko berreduren baturaren batazbestekoa: kalkulatzen da subjektu bakoitzetik batezbesteko orokorrera dagoen "distantzia" eta berredura egiten da. Gero dena batu eta askatasun graduengatik zatitzen da (n-k+1).

Lortutako bi emaitza horien zatiketa F balioa da.

F= taldeen arteko berreduren baturaren batazbestekoa/taldebarneko berreduren baturaren batezbestekoa

Page 21: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

21

4. Krusskall Wallis-en proba.

Noiz erabiltzen da?

ANOVA proba ezin denean erabili:

- Aldagai kualitatiboaren kategoria batean gutxienez, aldagai kuantitatiboa ez denean normalki banatzen.

- Aldagai kualitatiboaren banaketa ezberdinetan aldagai kuantitatiboaren bariantzak ez direnean berdintsuak.

Hipotesi nulua: ez dago harremanik bi aldagaien artean

Kasu honetan ez dugu hipotesi nuluaren adierazpen matematikorik eta hipotesi nuluaren probabilitatea ordenagailuz bakarrik kalkulatzen ikasiko dugu.

P<0,05 harremana dago biztanlerian bi aldagaien artean.

p>0,05 ez.

Hipotesia: Harremana dago edandako alkohol kopuruaren artean eta edateko ohituraren artean.

Edandako alkohol kopurua ez da normalki banatzen ez abstemioen artean, ez noiz-behinka edaten dutenen artean ez eta edateko ohitura dutenen artean ere, beraz ezin da ANOVA froga erabili. Horren ordez Krusskall Wallis-en froga erabiliko da. Honek botatzen duen hipotesi nulua ez da batezbestekoen berdintasunena. Ez gara hemen luzatuko. Oraingoz nahikoa da interpretazioa berdin egiten dela esatearekin.

Ikus daiteke p 0,05 baino txikiagoa dela. Horrek esan nahi du biztanlerian ere harremana dagoela edateko ohituraren artean eta edandako kopuruaren artean.

Page 22: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

22

Adibidea:

Susmoa: Unibertsitateko lehenengo urteetan ikasleak kanporakoiagoak dira

Biztanleria: Euskal Herriko Unibertsitateko ikasleak

Lagina: EHUko hiru Campusetatik (Gipuzkoa, Bizkaia, Araba) zoriz Campus bat aukeratzen da (Bizkaikoa ateratzen da). Fakultate guztietan zoriz 3 ikasmaila aukeratzen dira eta lehenengoa, hirugarrena eta bosgarrena ateratzen dira.

Neurketa: Hiru ikasmaila horietako ikasgela guztietara ikasleei abisatu gabe joan eta inkesta anonimo bat pasatzen zaie. Kanporakoitasuna EPI testarekin neurtzen zaie (test baliagarria kanporakoitasuna neurtzeko). Ikasmaila taldez-talde goazenean badakigu ze ikasmailakoak diren eta guk idazten dugu.

Galderak:

- Laginketa nolakoa da? - Idatzi hipotesia, hipotesi nulua eta hipotesi nulu estatistikoa - Ikerketak barne balidezia dauka? Zergatik? - Ze proba estatistiko erabiliko zenuke? Zergatik? - Harreman frogatu da bi aldagaien artean? Zergatik?

Page 23: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

23

Emaitzak: Partehartzea: %98

1. ikasmaila

N:2769

m: 11,6

me: 12

mo: 12

s: 3,8

δm: 0,07

3. ikasmaila

N: 1316

m: 11,1

me: 11

mo: 10

s: 3,8

δm: 0,1

5. ikasmaila

N: 1070

m: 10,7

me: 11

mo: 11

s: 3,8

δm: 0,12

Page 24: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

24

- Laginketa nolakoa da?

Saio anitzekoa, zorizkoa, mordozkoa

1. saioa: Hiru campusetatik zoriz bat hartu: zorizkoa, bakuna, mordozkoa 2. saioa: Bizkaiko Campusetik fakultate guztietan zoriz 3 ikasmaila hartu:

zorizkoa, bakuna mordozkoa

- Idatzi hipotesia, hipotesi nulua eta hipotesi nulu estatistikoa

Hipotesia: EHUko ikasleen artean harremana dago ikasmailaren eta kanporakoitasunaren artean

Hipotesi nulua: EHUko ikasleen artean ez dago harremanik ikasmailaren eta kanporakoitasunaren artean

Hipotesi nulu matematikoa: µµµµ1=µµµµ3=µµµµ5

µµµµ1= EHUko 1. ikasmailako ikasleen kanporakoitasunaren batezbestekoa

µµµµ3= EHUko 3. ikasmailako ikasleen kanporakoitasunaren batezbestekoa

µµµµ5= EHUko 5. ikasmailako ikasleen kanporakoitasunaren batezbestekoa

EHUko ikasleen kanporakoitasunaren batezbestekoa berdina da 1,3 eta 5 ikasmailakoentzat.

- Ikerketak barne balidezia dauka? Zergatik?

Bai

1. Azken lagina baliagarria delako (lagina adierazgarria eta partehartzea nahikoa) 2. Neurketa baliagarria delako (neurtresna eta neurketa egiteko modua baliagarriak

direlako. Neurtresna: galdeketa; Neurketa procesua: abisurik gabe inkesta anonimoa).

3. Diseinua baliagarria delako (Frogatu nahi dena frogatzeko, hau da harremana, nahikoa da diseinu epidemiologikoa)

Page 25: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

25

- Ze proba estatistiko erabiliko zenuke? Zergatik?

ANOVA.

Zergatik?

- Aldagai bat kuantitatiboa izanik eta bestea kualitatibo politomikoa, ANOVA delako lehenengo aukera (proba parametrikoak beti informazio gehiago ematen du).

- ANOVA erabiltzeko beharrezkoa diren bi baldintzak betetzen direlako: o 1. Normaltasunaren baldintza: kanporakoitasun aldagaia (kuantitatiboa)

normalki banatzen da ikasmailaren hiru kategorietan (aldagai kualitatiboaren hiru kategorietan).

� Ikus daiteke grafikoari begira: hiru banaketek kanpai itxura dute. � Gainera, hiru kasutan batezbestekoa, mediana eta moda

berdintsuak dira. � Hiru kasutan desbideraketa tipikoa batezbestekoaren erdia baino

txikiagoa da. � Hiru kasutan subjektu kopurua 30 baino handiagoa da.

o 2. Homozedastizitatea: kanporakoitasunaren banaketek 1. mailan, 3. mailan eta 5. mailan, antzeko bariantza dute (bariantza berdintsua aldagai kualitatiboaren kategoria ezberdinetako aldagai kuantitatiboaren banaketek).

� Ikus daiteke hiru banaketek desbideraketa tipiko berdina dutela. � Halere, egokiena Levenen proban ikustea da. Levenen proban

ikus daiteke hipotesi nulua ezin dela baztertu, 0,05 (%5) baino handiagoa delako (0,797) (Levenen probaren hipotesi nuluak hiru bariantzak berdinak direla dio). Beraz, bariantzak berdintsuak direla frogatzen da.

Page 26: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

26

- Harreman frogatu da bi aldagaien artean? Zergatik?

Beraz ordenadoreari ANOVA eskatzen diogu eta aurreko irteera ateratzen zaigu.

Lehenengo taulan estatistiko deskribatzaileak daude: N, batezbestekoa, desbideraketa tipikoa, batezbestekoaren akats estandarra, minimoa eta maximoa. Horrez gain, %95eko konfidantza tarteak daude(asmatzeko %95eko probabilitatearekin zenbatekoa den kanporakoitasunaren batezbestekoa biztanlerian, kategoria bakoitzarentzat eta guztira).

Taulan begiratuta esan genezake gure laginean kanporakoitasunaren batezbestekoa 11,3koa dela (lehenengo ikasmailan 11,6koa, 3. ikasmailan 11,1koa eta 5. ikasmailan10,7koa).

Lagineko datuei begiratuta ikusten da lehenengo ikasmailetan kanporakoitasunaren batezbestekoa handiagoa dela. Baina biztanlerian? Guk ez dugu biztanleria osoa ikasi, zati bat baizik (lagina). Horregatik inferentzia egingo dugu.

Inferentzia (%95). lagineko batezbestekoetatik habiatuta biztanleriako batezbestekoak inferituko ditugu. Programa estatistikoak ematen duen lehenengo irteera horretan %95eko konfiantza tarteak ematen dizkigu.

Asmatzeko %95eko probabilitatearekin, batezbestekoak biztanlerian:

- Ikasle guztiena: 11,20-11,41 - 1. ikasmailakoena…. 11,50-11,79 - 3. ikasmailakoena 10,85-11,27 - 5. ikasmailakoena 10,53-10,98

Ondorioa: asmatzeko %95eko probabilitatearekin Euskal Herriko Unibertsitateko ikasleen artean kanporakoitasunaren batezbestekoa ez da berdina hiru ikasmailetan. Euskal Herriko Unibertsitateko ikasleen artean kanporakoitasunaren batezbestekoaren berdintasuna, hipotesi nulua da (µµµµ1=µµµµ3=µµµµ5). Hipotesi nuluaren probabilitatea 0,05 baino txikiagoa da, beraz hipotesi nulua baztertu egiten da. Zergatik da hipotesi

Page 27: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

27

nuluaren probabilitatea 0,05 baino txikiagoa (%5 baino txikiagoa)? Asmatzeko %95eko probabilitateari, hipotesi nuluaren %5 dagokiolako.

Puntu honetara helduta beste bi galdera:

1. Jakin daiteke hipotesi nuluaren probabilitate zehatza? Bai, horretarako ANOVA proba parametrikoa egiten da (bariantzaren analisia)

2. Frogatu da asmatzeko %95eko probabilitatearekin batezbestekoak biztanlerian ez direla berdinak. Esan daiteke ezberdinak direla? (EHUko 1go,3. eta 5. ikasturteko ikasleen kanporakoitasunaren batezbestekoa ezberdina dela?). Hirurak berdinak ez badira, beraien artean ezberdinak ez dute zertan izan behar beti (bi beraien artean berdinak izan daitezke eta hirugarrena ezberdina). Horixe gertatzen da gure adibidean. Konfiantza tarteak ikusten badituzu konturatuko zara 3. eta 5. ikasturteko ikasleen kanporakoitasunaren batezbestekoak zanpatu egiten direla. Lehenengo ikasturteko ikasleen kanporakoitasunaren batezbestekoa ordea ez da ukitzen beste biekin. Asmatzeko %95eko probabilitatearekin beraz esan genezake ere, EHUko lehenengo ikasturteko ikasleen kanporakoitasunaren batezbesteko ezberdina dela hirugarren ikasturtekoena eta bosgarren ikasturtekoena.

Hipotesi nuluaren probabilitate zehatza (p, edo significance).

Bariantzaren analisiak horixe kalkulatzen du: hipotesi nuluaren probabilitatea.

Emaitza: p=0,000 Beraz, harremana frogatu da (hipotesi nuluaren probabilitatea 0,05 baino txikiagoa delako)

Beraz, hasierako galderari (bi aldagaien arteko harreman frogatu da? Zergatik?) hau erantzungo genioke:

Bai. Zergatik? Bi eratara erantzun daiteke:

- Asmatzeko %95eko probabilitatearekin inferitutako talde bakoitzeko batezbestekoak ez direlako berdinak

- Hipotesi nuluaren probabiliatea 0,05 baino txikiagoa delako.

Page 28: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

28

Adibidea 2:

Susmoa: Unibertsitateko ikasleen artean erlijiotasun gutxi dutenak kanporakoiagoak dira

Biztanleria: Euskal Herriko Unibertsitateko ikasleak

Lagina: EHUko fakultate bakoitzetik zoriz ikasleen %10 aukeratzen dira

Neurketa: Ikasle horiei inkesta anonimo bat pasatzen zaie.

Kanporakoitasuna EPI testarekin neurtzen zaie (test baliagarria kanporakoitasuna neurtzeko).

Erlijiotasuna: horretarako sortu eta balidatu zen galdera batekin. Hiru maila ditu:

-katoliko praktikantea,

-katoliko ez praktikantea

-indiferentea edo ateoa

Galderak:

- Laginketa nolakoa da? - Ikerketak barne balidezia dauka? Zergatik? - Ze proba estatistiko erabiliko zenuke? Zergatik? - Idatzi hipotesia, hipotesi nulua eta hipotesi nulu estatistikoa - Harreman frogatu da bi aldagaien artean? Zergatik?

Page 29: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

29

Emaitzak: Partehartzea: %92

katoliko praktikantea

N:1046

m: 11,26

me: 11

mo: 11

s: 3,64

δm: 0,11

katoliko ez praktikantea

N: 2483

m: 11,31

me: 12

mo: 11

s: 3,83

δm: 0,08

indiferentea ateoa

N: 1497

m: 11,31

me: 10

mo: 11

s: 4,04

δm: 0,1

Page 30: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

30

- Laginketa nolakoa da?

Zorizkoa, bakuna eta subjektuzkoa

- Ikerketak barne balidezia dauka? Zergatik?

Bai

1. Azken lagina baliagarria delako (lagina adierazgarria eta partehartzea nahikoa) 2. Neurketa baliagarria delako (neurtresna eta neurketa egiteko modua baliagarriak

direlako. Neurtresna: galdeketa; Neurketa procesua: inkesta anonimoa). 3. Diseinua baliagarria delako (Frogatu nahi dena frogatzeko, hau da harremana,

nahikoa da diseinu epidemiologikoa)

- Ze proba estatistiko erabiliko zenuke? Zergatik?

Kruskall Wallis.

Zergatik?

- Aldagai bat kuantitatiboa izanik eta bestea kualitatibo politomikoa, ANOVA da lehenengo aukera (proba parametrikoak beti informazio gehiago ematen duelako), baina kasu honetan ANOVA erabiltzeko bi baldintzak ez dira betetzen: normaltasunaren baldintza bete arren, homozedastizitatearena ez da betetzen..

o 1. Normaltasunaren baldintza: kanporakoitasun aldagaia (kuantitatiboa) normalki banatzen da ikasmailaren hiru kategorietan (aldagai kualitatiboaren hiru kategorietan).

� Ikus daiteke grafikoari begira: hiru banaketek kanpai itxura dute. � Gainera, hiru kasutan batezbestekoa, mediana eta moda

Page 31: 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana · 2009. 11. 3. · arrazoi eskalan neurtua) eta bestea bizi den kontinentea da (kualitatiboa politomikoa, eskala

BIOESTATISTIKA ETA DEMOGRAFIA http://www.ehu.es/xabier.zupiria/BIOESTATISTIKA_DEMOGRAFIA.htm ISBN 978-84-692-6329-7 6. Aldagai kualitatibo baten eta kuantitatibo baten arteko harremana.(4. edizioa) © Xabier Zupiria 2009 Debekatua fotokopiak egitea

31

berdintsuak dira. � Hiru kasutan desbideraketa tipikoa batezbestekoaren erdia baino

txikiagoa da. � Hiru kasutan subjektu kopurua 30 baino handiagoa da.

o 2. Homozedastizitatea: kanporakoitasunaren banaketek katoliko praktikanteen artean, katoliko ez praktikanteen artean eta indiferente-ateoen artean ez dute antzeko bariantza (bariantza berdintsua aldagai kualitatiboaren kategoria ezberdinetako aldagai kuantitatiboaren banaketek).

� Ikus daiteke hiru banaketek desbideraketa tipiko ezberdina dutela.

� Halere, egokiena Levenen proban ikustea da. Levenen proban ikus daiteke hipotesi nulua baztertu daitekeela, 0,05 (%5) baino txikiagoa delako, zehazki 0,001 (Levenen probaren hipotesi nuluak hiru bariantzak berdinak direla dio). Beraz, bariantzak berdintsuak direla ez da frogatu.

� - Idatzi hipotesia, hipotesi nulua eta hipotesi nulu estatistikoa

Hipotesia: EHUko ikasleen artean harremana dago erlijiotasunaren eta kanporakoitasunaren artean

Hipotesi nulua: EHUko ikasleen artean ez dago harremanik erlijiotasunaren eta kanporakoitasunaren artean

Hipotesi nulu matematikoa: Kruskal Wallis probaren hipotesi nulu estatistikoa idazten ez dugu ikasi.

- Harreman frogatu da bi aldagaien artean? Zergatik? - Ez.

Kruskall Wallis proban begiratu behar da. Hipotesi nuluaren probabilitatea ezin da baztertu, beraz ez dago harremanik.