Estatistika teoria eta praktika SPSSWIN erabiliz

396

Transcript of Estatistika teoria eta praktika SPSSWIN erabiliz

Page 1: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 2: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 3: Estatistika teoria eta praktika SPSSWIN erabiliz

ESTATISTIKATeoria eta praktika SPSSWIN erabiliz

Juan Etxeberria(EHUko irakaslea)

E L K A R T E AK U L T U R

Page 4: Estatistika teoria eta praktika SPSSWIN erabiliz

Hezkuntza, Unibertsitate eta Ikerketa Sailaren laguntzaz eta Euskal Herriko Unibertsitateko Errektoreordetza etaKutxaren arteko elkar lanerako itun bati esker luzatutako laguntzaz argitaratu da.

2. argitalpena

Azalaren diseinua: Olatz Rico, M.K. UrdangarinMaketa: Ana Gonzalez, Olatz Rico, M.K. Urdangarin

Ez da zilegi liburu hau osorik edo partzialki erreproduzitzea, ez informatikoki tratatzea, eta ezta inola edo dena dela-ko baliabidez (baliabide elektroniko, mekaniko, optiko, grabazio magnetiko, fotokopia, erregistro edo bestelakobaliabidez) transmititzea, Elhuyar K.E.ren aldez aurretiko idatzizko baimenik gabe.

© ELHUYAR, K.E. Asteasuain 14. Txikierdi. 20170 USURBIL (Gip.) (1999).E.mail: [email protected]

Lege-gordailua: SS-217/98ISBN: 84-87114-36-9

Fotolitoak: PhotoLine. Ibaeta etxea. Portuetxe bidea, 14, 3a. 13. bulegoa. 20009 Donostia (Gipuzkoa)Inprimatzailea: Litografia Danona. S.Coop. Ugaldetxo auzoa, z/g. 20180 Oiartzun (Gipuzkoa)

Page 5: Estatistika teoria eta praktika SPSSWIN erabiliz

Juana Mari eta Amaiari

Page 6: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 7: Estatistika teoria eta praktika SPSSWIN erabiliz

HITZAURREA

Ikusi nahi ditugun gauzak begiratzen ditugunean, betaurrekoak jartzen ditugu batzuetan eta

mikroskopioaz baliatzen gara besteetan; inoiz katalejoak, teleskopioa,... ere erabiltzen ditugu. Hauek

guztiak ikusi nahi dugun objektua ongi ikusteko erabiltzen ditugu.

Gauza edo elementu bat ongi ikusteko beti ez gara hurbiltzen; batzuetan urruntzea hobe dela ere

aitortu behar da.

Ikusi nahi dugun elementu, gauza edo errealitatera egokitzen gara, edo... egokitzen saiatzen gara.

Hau da estatistikaren errealitatea eta errealitatea ikusteko estatistikaren era.

Datu-multzo bat “ikusi”, “irakurri” edo “aztertu” nahi badugu, bere baitan daukan informazioa

ezagutu nahi badugu, estatistikak tresneria anitz eskaintzen digu, eta guk, tresneria honetaz baliatuz datu-

-multzo baten informazioaz jabetu nahi dugu.

Baina, hemen ere, errealitatean bezala, datu-multzo guztiak diferenteak dira. Edo datu-multzo bat

begiratzen dugun bakoitzean helburu berriak edo diferenteak izan daitezke. Batzuetan xehetasun bat

begiratu nahi izaten dugu eta aldagai bakar bat aztertu; beste batzuetan, datu-multzoa orokorrean eta

datu-multzoaren azpiegitura aztertuko ditugu, edo helburu diferenteak eduki ditzakegu.

Hau guztia egiteko, datuak eta elementuak ondo begiratzeko, bi gauza dira beharrezkoak. Lehenengo,

estatistikak eskaintzen digun “tresneria” zein den jakin behar dugu, eta bigarren, tresneria hau nola

erabiltzen den eta erabiltzeko bete behar diren baldintzak ezagutu behar ditugu.

Hau da, Estatistikari buruz, liburu honetan eman nahi den ikuspuntua.

Beste arlo batera begiratuta, Estatistikaren beharra bi ikuspuntu osagarritatik ere agertzen zaigula argi

ikus genezake.

Alde batetik, gehienetan, beste batek eskainitako emaitzak ikusi eta irakurtzen ditugu. Egunero ikusten

ditugu emaitza estatistikoak, bai egunkarietan, bai edozein txostenetan eta bai ikerketa-artikuluetan ere.

Bestalde, txosten bat geuk egiten dugunean, askotan datuez baliatzen gara eta horretarako balio edo

indize estatistiko ezberdinen beharra izaten dugu. Hau ez da ohiko egoera, baina gero eta gehiagotan

estatistikaz baliatzen gara gure adierazpenak egiaztatzeko.

V

Page 8: Estatistika teoria eta praktika SPSSWIN erabiliz

Liburu hau, bi behar edo ikuspuntu hauei erantzuteko planteatuta dago, baina garrantzi berezia

lehenengoari emango diot. Beraz, liburu honen helburu garrantzitsuenetako bat emaitzen irakurketa eta

interpretazio zehatza egiteko arauak ematea da.

Hala ere, ezin dugu ahaztu emaitzak lortzeko eman beharreko pausoak zeintzuk diren. Eta bide

honetan aipatu, azkeneko hamarkadan informatikak hartu duen garrantziarekin estatistikako ohitura

denak erabat aldatu egin direla. Gaur egun, ia inork ez ditu bere kalkuluak eskuz egiten eta informatikak

oso tresneria baliagarriak eskaintzen dizkigu kalkulu guztiak era oso errazean egiteko.

Azken hamarkada honetan estatistikako programa-pakete asko kaleratu dira, eta hauetatik giza

zientzien arloan gehien erabiltzen dena SPSS programa-paketea da. Hau kontuan harturik, liburu honetan

SPSS erabiliko dugu bai emaitzak lortzeko, eta bai emaitzen irakurketarako behar diren arauak zeintzuk

diren ikusteko.

SPSS programa-paketeak oso bertsio ugari ditu merkatuan eta informatika-munduan bertsioak zein

abiadura handiz aldatzen diren ikusita, guk aukeraketa egin dugu: lehenengo PCrako egokitutako

bertsioak, gero Windows 95erakoak. Eta azkenik bi bertsio berrienak: bata, 6.1.3 bertsioa, 1996. urtean

kaleratutakoa eta bestea, 7.5 bertsioa, 1997ko irailean kaleratutakoa. Biak gaztelaniaz daude, baina

lehenengoaren emaitzak ingelesez agertzen dira. Azkeneko bi bertsio hauek erabiltzeko arrazoia hau da:

7.5en azken bertsioa erabiltzeko behar diren ordenadoreak oraindik oso zabalkunde urria izatea.

Bi bertsio hauek erabiltzeak, liburua ere nolabait baldintzatzen du. Bi bertsioetako emaitzak aurkituko

dituzu; itxuraz diferenteak, baina benetan inportanteak direnak, emaitzak, beti berdinak. Beharbada,

emaitzen irakurketarako argibideak ematerakoan, nahasketak sor litezke, batez ere ingelesa eta

gaztelaniaren artean. Adibidez 6.1.3 bertsioak batezbestekoa Mean izenarekin agertzen du eta 7.5

bertsioak Media izenarekin. Beste arazorik ez dago.

Dena den, SPSSWIN erabiltzeko argibideak (11. gaian) 7.5 bertsiokoak ematen dira.

Aipatu dugu, estatistikako teknika ezberdinak nola erabiltzen diren ikusiko dugula. Baina teknika

hauek behar den bezala erabiltzeko, estatistikaren oinarri teoriko minimo batzuk ere ikustea beharrezkoa

dela uste dugu.

Hauek guztiak kontuan hartuta, liburuaren egitura hau da.

Oinarrizko kontzeptuak lehenengo gaian ikusi ondoren, bigarren eta hirugarren kapituluetan

estatistika deskribatzailearen indize garrantzitsuenak ikusten dira.

4. gaian Probabilitatearen teoria ikusten da, 5.ean banaketa normala nola erabili ikusten delarik.

Inferentzia estatistikoaren oinarriak, liburu honetan funtsezkoa den 6. gaian aurkezten dira, gai

honetan agertzen diren kontzeptuak hurrengo 4 gaietan behar beharrezkoak izango direlarik.

VI

Page 9: Estatistika teoria eta praktika SPSSWIN erabiliz

7.ean Ji karratuaren testa eta K-S Kolmogorov-Smirnovena ditugu aztergai. 8.ean bi batezbestekoen

emaitzak, T-testa eta dagozkion froga ez-parametrikoak erabiliz, nola konparatu ikusiko dugu.

9.ean bariantza-analisiaren oinarriak eta emaitzak irakurtzeko baliabideak zeintzuk diren zehaztuko

dugu.

Zati hau bukatzeko, 10. gaian Erregresioari dagokion gaia duzu.

Liburu honen azken gaian, 11.ean SPSSWIN 7.5 bertsioa erabiliz analisi estatistiko ezberdinen

emaitzak lortzeko eman behar diren pausoak zeintzuk diren zehazten da. Datuak nola sartu, pantaila

ezberdinak aurkeztu, emaitzak nola lortu,... Hau guztia 11. gaian ikusiko da.

Liburuan zehar adibide asko erabiliko ditugu; hauek fitxategitan bilduta daude eta Elhuyarren Web

guneko (www.elhuyar.com/irak.html) SPSSWIN FITXATEGIAK loturan topatuko dituzu.

JIKARRA.SAV ANOVA.SAV REGLIN.SAV

REGRESIO.SAV TTESTPAR.SAV LIBURU.SAV

ADIBIDE.SAV ADIBIDE2.SAV VIKI.SAV

Fitxategi hauetako bakoitza zure ordenadorera kargatzeko, nahikoa da kargatu nahi duzun

fitxategiaren izenean klik egitea. Modu honetan fitxategiak zuk aukeratu edo sortutako karpetan gorde

ahal izango dituzu.

Bost lehenengoak adibide puntualak dira eta izenak aipatzen duen gaian bakarrik erabiliko dira.

Azkena, LIBURU.SAV, liburu osoan, gai guztietan, erabiliko den adibidea da. Hau dela eta, fitxategi

honen aurkezpen labur bat egiteak merezi duela uste dut.

Asmatutako datuekin eraikitako adibide bat da. Demagun ikerlari batzuek hainbat ikastetxetako

ikasleen datu ezberdinak bildu dituztela. Ikastetxe bakoitzean bost froga ezberdin egin dituzte; baita 5 gai

ezberdinetan umeen notak bildu ere. Umeen gurasoen aldagai batzuk, ikastetxeetako ezaugarri batzuk,

eta abar ere landu dira. Batutako aldagai guztien zerrenda eta hauen definizio labur bat hau da:

AITAIKAS. Aitaren ikasketak

AMAIKASK. Amaren ikasketak

BIOLOGIA. Biologiako frogan lortutako emaitzak

EREDUA. Ikastetxearen hizkuntz eredua

ERREPKUR. Ikasleak inoiz kurtsoren bat errepikatu duen ala ez

EUSKAITA. Aitaren euskara-maila

EUSKAMA. Amaren euskara-maila

EUSKTOT. Euskarako frogan lortutako emaitzak

HOBEKUNT. Ikasteko ohituran lortutako hobekuntza

INGELES. Ingeleseko frogan lortutako emaitzak

LENGUA. Hizkuntzako frogan lortutako emaitzak

MATEMATI. Matematikako frogan lortutako emaitzak

NATURA. Naturako frogan lortutako emaitzak

VII

Page 10: Estatistika teoria eta praktika SPSSWIN erabiliz

NOTAEUSK. Euskara ikasgaiko nota

NOTAFISI. Fisika ikasgaiko nota

NOTAINGL. Ingelesa ikasgaiko nota

NOTALENG. Hizkuntza ikasgaiko nota

NOTAMATE. Matematika ikasgaiko nota

OHITURA1. Ikasteko ohituren lehen neurketa

OHITURA2. Ikasteko ohituren bigarren nota

PROBINTZ. Probintzia

PUBPRIBA. Ikastetxe-mota: publikoa ala pribatua

RAVEN. Inteligentzia neurtzeko erabili dugun RAVEN testaren emaitza

SEXUA. Sexua

TRATAMEN. Ikasteko ohiturak hobetzeko erabili dugun metodoa (tratamendua)

ZENBAKIA. Ikasle bakoitzari identifikatzeko jarri diogun zenbakia

Sarrera labur hau bukatzeko, desiotxo hau agertu nahi nuke, liburu hau geuk estatistika gehiago eta

hobeto erabiltzeko izan dadila eta besteek erabilitakoa zuhurtziaz geureganatzen jakin dezagula.

Liburu hau aurrera ateratzen hainbat pertsonak lagungu didate. Hauen artean bereziki hiru lagunei

eman nahi nizkieke eskerrak: lehenengoz, Izaskun Ibabe eta Olga Cruzi, beren garrantzizko

aholkuengatik, eta bestalde, Nerea Orbañanos, borondate handiz, eta gehienetan korrika eta presaka,

liburu hau egiten sartu dituen ordu pilagatik. Mila esker.

Azkenik ohartxo bat liburu honi buruz; estatistikari buruz, edo hemen aurkitzen dituzun gai edo

gauzei buruz, ezer esan nahi baduzu, hau da orri hauen arduradunaren e-maila: [email protected]

VIII

Page 11: Estatistika teoria eta praktika SPSSWIN erabiliz

AURKIBIDEA

Or.

1. ESTATISTIKA: OINARRIZKO KONTZEPTUAK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

2. ALDAGAI BATEN ESTATISTIKA DESKRIBATZAILEA. DATUEN

ANTOLAKETA ETA AURKEZPENA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3. ESTATISTIKA DESKRIBATZAILEA. BI ALDAGAI EDO GEHIAGO . . . . . . . . . . . . . . . . 85

4. PROBABILITATEA ETA PROBABILITATE-BANAKETA . . . . . . . . . . . . . . . . . . . . . . . . . 125

5. BANAKETA NORMALA ETA NORMALEAN OINARRITUTAKOA . . . . . . . . . . . . . . . . 157

6. INFERENTZIA: OINARRIZKO KONTZEPTUAK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

7. JI KARRATUA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215

8. BATEZBESTEKOEN KONPARAKETA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243

9. BI TALDE BAINO GEHIAGOREN BATEZBESTEKOEN KONPARAKETA . . . . . . . . . . . . 273

10. ERREGRESIO ANIZKOITZA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305

11. SPSSWIN 7.5 BERTSIOA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341

IX

Page 12: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 13: Estatistika teoria eta praktika SPSSWIN erabiliz

1. ESTATISTIKA: OINARRIZKO KONTZEPTUAK

1.1. ADIBIDEAK

1.1.1. Lanaren eta langabeziaren indizea

1.1.2. KPIa

1.1.3. Neurrien edo batezbestekoen konparaketa

1.1.4. Estatistika deskribatzailea. Estatistika inferentziala

1.1.5. Aladagien arteko erlazioa

1.2. ESTATISTIKAREN KOKAPENA

1.3. OINARRIZKO BEREIZKETA ESTATISTIKAN

1.4. NEURKETA

1.4.1. Neurketa-eskalak

1.4.2. Neurketa-eskalen sailkapena

1.5. ALDAGAIAK

Page 14: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 15: Estatistika teoria eta praktika SPSSWIN erabiliz

3

1. ESTATISTIKA: OINARRIZKO KONTZEPTUAK

Denok hitz egiten dugu estatistikeei buruz.

Denok, zenbait momentutan, estatistikak erabiltzen ditugu. Fakultate bateko ikasleen % 70emakumeak dira, gela horretako ikasleen adinaren batezbestekoa 21.7 urtekoa da, A Alderdiak lortukoduen botu-portzentaia % 37koa da,...

Beste askotan, ohartu gabe, kontzeptu eta teoria estatistikoak erabiltzen ditugu: egingo dueneguraldiaren aurreikuspena irakurri edota ikusten dugunean, langabetuen portzentaiaz hitz egitendigutenean...

Gehienetan ez gara estatistiken erabileraz ohartzen eta, hala ere, ikerketa zientifikoetako prozesuaskotan agertzeaz gain, eguneroko bizitzan, hamaika aldiz erabiltzen ditugu; batezbestekoa,portzentaia... eta antzeko hitzak erabiltzen ditugun aldiak, kontaezinak dira.

“Hala ere Estatistika, estatistikak baino askoz gehiago da”.

Hasieran, Estatuaren informazio-multzoa baino ez zen, hortik bere izena, baina aldatuz eta garatuz joanda analisirako metodo zientifiko bihurtu arte; metodo hau orokorrean Gizarte Zientzietan eta zehazkiGiza Zientzietan aplikatzen da.

Horrelako diziplina bat definitzea lan zaila da, baina datuak jasotzeko era bat eta, batez ere, datuakinterpretatzeko modua dela esan genezake. Gauzak ongi ikusi nahi ditugunean lupa, prismatikoak,teleskopioa edota mikroskopioa erabiltzen ditugu. Batzuetan hurbildu egiten gara eta besteetan,perspektiba eduki ahal izateko, urrundu... Estatistika hau guztia da, baina datu zehatzekin. Geure datuakbegiratu eta ikusten irakasten digu. Zenbaitetan irudiaren aurrean ezartzen irakasten digu, besteetaninterpretatzen,...

Hoberena, Estatistikaren erabilpenaren adibide batzuk ikustea izango da, bide batez aukeren berriemango baitigute.

1.1. ADIBIDEAK

1.1.1. Lanaren eta Langabeziaren indizea

1996. urtearen erdialdera Gipuzkoako langabezia-datuak honakoak ziren (Iturria: Eustat. Inkesta PRA, 2ºtrimestre 1996): populazio aktiboa 303.500 pertsona, populazio okupatua 239.900, populaziolangabetua 63.600 pertsona; hemendik, langabezia-tasa lortzen dugu: % 21,0. Datu hauek horrelabegiratu ezkero ukaezinak dira, errore-marjinak egon daitezke jendearen tranpen, ekonomiamurgilduaren, etab.en arabera. Baina estatistikaren lana amaitu da. Zenbatze-lana besterik ez da izan.

Halere, soziologoak erantzun behar dituen eta zenbatze-lanaren aurretikakoak behar duten galderaezberdinak sortzen dira. Hona hemen adibide moduan planteatutako batzuk: langabetu guztiaklangabezian al daude? Non kokatu dira etxekoandreak? Langile aktibo bezala zenbatu badira, zenbatuakizan behar al lukete? Exekoandre batek etxetik kanpo lan egin nahiko balu, lana lortzen duen bitarteanlangabezian al dago? Pertsona batek pizzak entregatzen badihardu, baina aldi berean lan egonkorragoabilatzen ari bada, zein taldetan sartuko da?

Norberaren iritziaz kanpo, bistakoa da galdera hauek, lortzen den langabetuen portzentaian eraginzuzena izango dutela. Ez dago arazorik metodo estatistikoari dagokionez, baina bai erabakiak hartzekogaraian edo “pertsona langabetua” definitzeko garaian.

Edozein kasutan, zuzenagoa litzateke emaitza estatistikoak konfiantza-tarte batez aurkeztea. Haueneraikuntza-metodoak 6. gaian aztertuko ditugu.

Page 16: Estatistika teoria eta praktika SPSSWIN erabiliz

1.1.2. KPIa

KPIren (Kontsumorako Prezioen Indizearen) kalkulua, IPC ospetsua, Estatistika Institutu Nazionalak egitenduen lanetako bat da; indize honek geure soldatan eragin zuzena du. Bere kalkulurako jarraitzen denmetodoa1 honakoa da: lehenik, jendeak dirua zertan gastatzen duen aztertzen da. Familia arrunt batekdituen gastuak eta pertsona arrunt batek dituenak aztertzen dira,...eta honi Erosketetako Saskia deritzo.Behin Saski hau zein den erabaki ezkero, erraza da Saskiak hilabete honetan balio duena eta aurrekoanbalio zuenaren arteko diferentzia lortzea.

Halere, bi oztopo sortzen dira erraz:

1.- Guztiek ez dute gauza berean gastatzen dirua.

Hau da, barazkijaleari ez zaio haragiaren igoera axola, ezta zigarrorik erretzen ez duenari tabakoarenaere (baina bikotekideak erretzen badu?)...

Arazo hau gainditzeko, familietako 1990-91ko aurrekontuetan oinarrituz, Espainiako familia arruntbatek kontsumitzen dituen ondasun-multzo adierazgarrienen 471 artikuluren zerrenda lortu zen. Artikulu--zerrenda oso luzea da eta kategoria desberdinetan sailkatzen da. Kategorietako bat Elikadura da etabestea Medikuntza. Baina noski! jendeak ez du jakietan, medikutan gastatzen duen diru-kopuru berdinaxahutzen, eta gertaera hau ere kontuan izaten da, kategoria bakoitzari gastuen totalari dagokion partehar-tzearen portzentaia edo pisua gehituz. Emaitza honakoa da:

Espainiako familia arrunt batek (Zer da, ordea, Espainiako familia arrunta?), bere dirua kategoriahauetan gastatzen du, ondoren adierazten den portzentaian:

Elikadura, edariak eta tabakoa % 29.36

Garraioa eta komunikazioak % 16.54

Jantzi eta oinetakoak % 11.48

Etxebizitza, berokuntza eta ura % 10.28

Aisia, irakaskuntza eta kultura % 7.27

Tresneria eta etxerako zerbitzuak % 6.68

Medikuntza eta osasuna % 3.13

Beste ondasun eta zerbitzuak % 5.26

Horrela, batezbeste, jendeak, Elikadura, edariak eta tabakoaren kategorian, Etxebizitza, berokuntzaeta ura-ren kategorian baino 3 aldiz gehiago gastatzen duela ikus daiteke; medikuntza eta osasuneanaisia, irakaskuntza, kultura eta abarrean gastatzen denaren erdia baino gutxiago...

Hau noski orokorrean da! Edo bestela esan diezadatela niri; oraintxe Donostian etxe bat erosi dut, etaKutxak hilero kentzen didan portzentaia %10 horren oso goitik baitago! Espero dezagun bizi osoanhorrela ez izatea!

Bestetik, kalkulu hauek 1991.ean egin ziren eta orokorrean berehala desfasatuak geratzen dira.Hemendik bi urte barru beste bat egitea espero da, non urte hauetako desbideratze txikiak zuzendutaazalduko diren.

Edonola ere, beti gogoan izan behar dugu batezbesteko kontsumoaz ari garela. Hau azterketaestatistiko gehienen ezaugarri garrantzitsu bat da, ez da kasu zehatzez hitz egiten, talde orokorrez baizik.

Baina adibide honetan, beste arazo txiki bat ere badugu.

4

11997ko Iraileko datuak

Page 17: Estatistika teoria eta praktika SPSSWIN erabiliz

2.- Leku guztietan gauzek ez dute berdin balio.

Egia da Donostiako etxebizitzen prezioa ez dela Oñati, Tolosa, edo Gasteizkoenen berdina. Nonahiere garestiak dira, baina leku batzuetan besteetan baino gehiago. Eta gauzek gaur berdin balio ez baduteere, ez dira portzentaia berean garestituko.

Orduan, nola kalkulatuko dugu etxebizitzen edo patata-kiloaren prezio-igoera, lekuaren araberadesberdin balio badu eta desberdin garestitu edo (amets egin dezagun) merketzen bada? eta are gehiago,zein da kafe-kiloaren edo Coca-Cola lata baten prezioa, hiri bereko komertzio desberdinetan, kafe nahizCoca-Colaren prezioa aldatzen bada?

Arazo hau konpontzeko ere batezbestekoa kalkulatuko dugu.Aurreko eragozpenak leundu eta batezbestekoak kalkulatu ahal izateko, hilero 150.000 prezio baino

gehiago biltzen dira Espainia osoan banatutako 2.000 bat establezimendu komertzialetan. Eta datuhauetan oinarrituz, IPC edo KPIren kalkulura jotzen da. Hau, Espainiako familia arrunt baten batezbestekokontsumoaren batezbesteko gehikuntza baino ez da. Eta batezbesteko hauen guztien kalkulurakoEstatistikak salto txikiak emanaz joan behar izan du, besteak beste, nire soldataren igoera baldintzatukoduen balio bakar batera eramango gaituelarik.

1.1.3. Neurrien edota batezbestekoen konparaketa

Hau estatistikaren beste arazo ohizkoenetako bat da. Gizonak emakumeak baino altuagoak al dira?Ingelesa ikasteko lau metodotatik zein da hoberena? Ikastetxe pribatuek publikoek baino emaitza hobeaklortzen al dituzte? Letxuga eta barazki hobeak noiz lortzen dira ilgoran, ilbeheran ala ilargi betekogauetan landatzen direnean?

Guztiak galdera interesgarriak dira eta estatistika inferentzialaren barnean egonik, erantzun ahalizateko erabili beharko litzatekeen lan-metodoa zein den ikusten saiatuko gara liburu honetan.

1.1.4. Estadistika deskribatzailea. Estatistika inferentziala

Garrantzi handiko eta oinarrizko sailkapena da hau. Ikus ditzagun adibide batzuk.

Estatistika deskribatzaileaz ari gara, esaterako, bezperan gertatutako hauteskunde-emaitzak deskriba-tzen badira. Estatistika inferentzialaz jardungo gara datorren astean izango diren hauteskunde-emaitzeiburuzko aurreikuspena egiten denean.

Estatistika deskribatzaileaz ari gara kaiola bateko txori-kopurua zenbatzen denean. Estatistika inferen-tzialaz ari gara denboraldi batean Euskal Herria zeharkatzen duten uso-kopuruaren hurbilketa bat egitendenean.

Deskribatzaileaz ari gara Gipuzkoa eta Bizkaiko ikastetxeetako emaitza akademikoak konparatzendirenean. Inferentzialaz ariko gara Gipuzkoako ikastetxe guztiak Bizkaiko guztiekin konparatu nahikobalira, eta horretarako probintzia bakoitzeko 5 ikastetxe hautatuko balira.

Deskribatzaileaz ari gara ikastetxe bateko ikasgelan 3 aldagairen artean dauden erlazioak aztertzendirenean. Inferentzialaz ariko gara hiru aldagai hauetakoren baten emaitza aurreikusi nahi denean, bestebien balioak bakarrik ezagututa.

Estatistika deskribatzaileaz ari gara ospitale batean iaz eginiko ebakuntza-kopuruaz, gaixo bakoitzarenospitalizazio-denboraren batezbestekoaz,... ari garenean. Estatistika inferentzialaz ariko gara datozen 5urteetan giltzurruneko gaixoak behar bezala zaintzeko ospitale batek behar duen ohe-kopuruarenaurreikuspena egin behar bada. Edo gaixo baten sintomen aurrean, medikuak ebakuntza egingo duen alaez erabaki behar denean...

Bien arteko ezberdintasunak geroago definituko ditugu, baina orokorrean esan dezakeguoinarrizkoena errore-marjina dela.

5Estatistika: oinarrizko kontzeptuak

Page 18: Estatistika teoria eta praktika SPSSWIN erabiliz

Eta horrela estatistika deskribatzaile eta inferentzialaren arteko adibideak emanaz segi dezakegu. Bienarteko oinarrizko ezberdintasuna errore-marjina da. Inferentzialean probabilitatea dago jokoan; errore--marjinak daude. Aztertu nahi diren subjektu guztien datu edo emaitza guztiak ez dira erabiltzen.Horregatik, liburu honen gaietako batean, Probabilitatea jorratuko dugu. Estatistika deskribatzailearenkasuan, ez dago modu honetako erroreentzako lekurik, aztertu nahi diren subjektuen datu guztiak erabil-tzen baitira.

1.5. Aldagaien arteko erlazioa

Denok dakigu pertsonen altuera zenbat eta handiagoa izan, pisua handiagoa dela (batzuetan). Edoargienek nota hobeak ateratzen dituztela (batzuetan). Edo autopista batean 120 km-ko abiaduran joanda60 km-koan joanda baino denbora gutxiago, hau da erdia, pasako dela distantzia bera egiteko (bestelakoarazorik ez den bitartean).

Lehenengo bien eta hirugarren esaldien arteko ezberdintasuna funtsezkoa da.

Lehenengo bietan bi aldagaiek (pisua/altura, adimena/notak) erlazioa dute, baina hirugarrenean, abia-dura eta denboraren arteko erlazioa baino zertxobait gehiago dago; espazioarekin ere elkartzen dituenfuntzio matematiko bat dago.

Abiadura eta denboraren kasuan ekuazioa zehatza da, beste kasuetan, joerak daude..., normalkigertatzen da, baina salbuespenak daude..., altuera gutxi duen jende pisutsua bada, edo altuak baina pisugutxikoak, nota txarrak ateratzen dituzten pertsona argiak bezala...

Estatistikaren azken helburu diren aldagaien arteko erlazioez ari gara; batez ere, gizarte-zientziei ego-kitutako estatistikarena. Ez da aldagaiak modu isolatuan aztertzea interesatuko, besteekin erlazionatutabaizik. Pedagogo batek, eskola-errendimendua aztertzen ari denean, errealitatean (gehienetan) aldagaizehatz batzuk eskola-errendimenduarekin duten erlazioa aztertzen du. Edo psikologo bati, depresioaaztertzen duenean, honen zergatiak, ondorioak edo zein aldagairi elkartua dagoen aztertzea interesatukozaio. Modu taldekatuan aztertzea interesatzen den aldagai-multzoaz ari gara.

Matematika edo fisikan ere erlazioaz ari gara baina, gehienetan, bi kontzeptu elkartzen dituenekuazioaz; horrela, erlazio funtzional bat bada gradu zentigradu eta gradu Farenheiten artean. Edo mate-rial-motaren eta erresistentzia elektrikoaren artean, edota...

Aldagaien arteko erlazioez hitz egiteaz gain, beste salto bat ere eman daiteke: aurrerapauso hauiragarpenetara pasatzea; hau da, nolabaiteko aurresanak egitera pasatzea.

Estatistika erabiliz iragarpenak egiten diren adibide garbienetako bat, edo egiten dituen kasu bat,eguraldiaren berri ematen duenarena da. Honek, egunaz dituen datuetan oinarrituta: presio atmosferikoa,eguraldi-satelitetik hartutako argazkiak,... hurrengo egunerako eguraldiari buruzko iragarpena egiten du.Behin baino gehiagotan ikusi izan dugun bezala, noizean behin horiek ere hanka sartzen dute. Hau da,hanka sartzeko arriskua hor dago, nahasteko probabilitatea hor dago, baina... hau inoiz azaltzen ez dutendatua da. Dena den, ez dakit nola erreakzionatuko genukeen honelako iragarpen baten aurrean: bihareguzkia izango dugu % 57ko probabilitatearekin, lainotua egongo da % 24koarekin eta euria egingo du% 19ko probabilitatearekin. Eta aldiz, bere iragarpen estatistikoen emaitza era honetakoa izan zitekeengutxi gorabehera.

Ikus dezagun adibide hau bera nola eramaten dugun ikasgela bateko ikasleen eskola-errendimendura.

Ikasgelako andereñoak, Gabonak iristean, errore-tarte txikiaz, badaki bere gelako haurretatik zeintzukizango diren kurtso bukaeran eskola-errendimenduan arazoak izan ditzaketenak.

Berak, buruz, erregresio anizkoitzeko analisi estatistiko bat egin du, horretarako, bere buruan gelakoikasleei buruzko datu ugari pilatu dituelarik, gero behar bezala ordenatu ditu eta haur hauei buruz jasoduen ezagutzatik abiatuz, zenbait haurrengan eskola-errendimenduko arazoak iragartzera ausartzen da,eta gero, arazo hauetako askori irtenbidea eman ahal izango dio eskola-errendimendu txar bihurtu baino

6

Page 19: Estatistika teoria eta praktika SPSSWIN erabiliz

lehen. Noski, gure andereñoak ere errore-probabilitate bat badauka, eta hanka ez sartzekoprobabilitatearen kalkulua egitea besterik ez zaio geratzen bere iragarpena estatistikoki zuzena izandadin.

Guretzat erregresio anizkoitzaren arazoa honakoa da: zertan oinarritu da andereñoa ikasleen erren-dimenduari buruzko iragarpena egin ahal izateko? Galdera hau, ziur aski andereñoak berak ere horreta-rako erantzunik ez duena, da gaiaren koska. Zein izango dira ikasle baten eskola-errendimendua iragar-tzen lagunduko duten aldagaiak? Edo, eskuartean ditugun datuekin, zenbateraino egin dezakegu ikasleeneskola-errendimenduari buruzko iragarpena? Eta eskola-errendimenduari buruzko iragarpena eginezgero, zein dira errore-marjina eta hanka sartzeko probabilitatea?

Galdera hauei erantzutea erregresio anizkoitzaren helburua da, hau da, lehenengo, ikaslearen eskola--errendimenduan eragina duten aldagaiak zein diren jakin. Bigarrenik, hauen arteko erlazioak aztertu.Hirugarren, errendimenduan eragina duten aldagaiak eta eskola-errendimendua bera ondoen erlazio-natzen dituen ekuazioa kalkulatu. Laugarren, kasu zehatzetarako eskola-errendimenduaren iragarpenaegin. Bosgarren, errore-marjinak mugatuz, iragarpenaren emaitzaren onargarritasuna kalkulatu.

Aurreko adibideetan ikusi ahal izan dugun bezala, estatistika datu-multzo bat modu laburragoanaurkeztea helburu duen teknika-multzoa baino zerbait gehiago da. Nahi bada, antzinakoena denestatistikaren zati hau teknika eta prozedura batzuekin osatuko dugu, azken hauek lagin bateko emaitzak(elementuen talde txikia) populazio batera (elementuen osotasuna barnean hartzen duen taldea)orokortzen lagunduko digutelarik.

Liburu honen helburuetariko bat, Gizarte Zientziei aplikatutako Estatistikaren ikuspen zabala emateada; ahalik eta zabalena: estatistika, bere oinarriak, kontzeptuak, aplikazioak...

Sarritan estatistikak fama txarra duela aitortu beharra dago.

Hau ez da estatistika, berez, tranposoa edo iruzurtia delako; arazoa erabiltzaileona, gurea, da.

Esan beharra dago, gai honen berezko izaerak ere horretako aukera ematen duela. Hemen adibidepare bat.

Aurretik abisatzen dizut: iruzur egingo dizudaneko adibide bat aurkeztuko dizut.

Pentsa dezagun bi sendagairen eraginak aztertu nahi dituen sendagile profesional batengan.

Sendagaiak: Aspirina eta Bespirina.

Horretarako, dagokion metodologi eskuliburua begiratu ondoren, bi esperimentu egitea erabakitzendu, bata urtarrilean eta bestea ekainean. Gure sendagileak lortutako emaitzak honakoak dira:

Sendatu diren pertsonen portzentaia URTARRILA EKAINA

Aspirina % 40 % 80

Bespirina % 30 % 70

Datuak ikusi ondoren, argi dago Aspirina Bespirina baino hobea dela; hau da, Aspirinak, Bespirinakbaino jende gehiago sendatu duela.

BAINA HORI GEZURRA DA!!!

Ikus dezagun taula honen atzean ezkutatzen den iruzurra: tratamendu bakoitza aplikatutako jende--kopuruaren datua ezkutatu dugu.

7Estatistika: oinarrizko kontzeptuak

Page 20: Estatistika teoria eta praktika SPSSWIN erabiliz

Demagun gure mediku ikertzaileak urtarrilean 1.000 pertsonari Aspirina aplikatu diela eta Bespirina100 pertsonei, eta ekainean alderantziz egin duela: Aspirina 100 pertsonari aplikatu eta Bespirina 1.000pertsonari.

Ondorengo taulan sendagai-mota bakoitzarekin sendatutakoen kopurua ikus daiteke:

OROTARASendagaia URTARRILA EKAINA

sendatutako pertsonak

Aspirina 400 80 480

Bespirina 30 700 730

Bespirinak Aspirinak baino 250 pertsona gehiago sendatu dituela ikusten da, edota berdina dena,orotara Aspirinak baino % 52 gehiago sendatu duela. Argi eta garbi arazo edo akats metodologikoakdaudela argudia daiteke, eta egon badaude, baina dudarik gabe aurreko taula bezalako batenaurkezpenak akatsera garamatza.

Beste adibide bat. Eta oraingoan beste arazo mediku bat dugu ikerketagai.

Baina, hasi baino lehen, utz iezadazu estatistikaren oinarrizko atal bat erabakiak hartzen laguntzeadela esaten. Noski, erabaki hau hartzeko, lehenagotik arazo edo kezka bat beharko da, eta zenbakiakerabiliz edota zenbakitan jarriko diren aldagai edo neurri batzuk erabiliz, estatistikak erabakiak hartzenlagunduko du.

Goazen bada gure adibidea ikustera.

Kontsidera dezagun egoera “nahikoa gogor” bat. AITOR deituko dugun paziente edo gaixo bat, dituensintomak direla eta, HIESaren antigorputzak dituen ala ez erabakitzeko froga bat egitera bidaltzen dumedikuak.

Emaitzak positiboak izan dira; antigorputzak dituela adierazten dute.

Aitor, normala denez, kezkatuta gelditu da eta egin dioten frogaren ezaugarriak aztertzera joan da.Aitorrek aurkitu dituen emaitza estatistikoak hauek izan dira. Frogak sentsibilitate-maila altua du(% 99.5); hau da, froga honek eramailea den jendearen % 99.5 antigorputzen eramaile bezala detektatzendu. Gaixorik dauden % 99.5 HIESarekiko positibotzat jotzen ditu. Gaixorik dauden % 0.5 analisi edofroga honen emaitzen arabera gaixorik ez baleude bezala agertuko lirateke (analisian bere emaitzaknegatiboak izango lirateke), beraz kasu hauetan gure frogak hanka sartzen du.

Frogak zehaztasun-maila ere altua du (% 99); hau da, HIESaren antigorputzik ez dutenen % 99rinegatiboa (pertsona osasuntsu direla, alegia) ematen die. Kasuen % 1ean, berriz, pertsona osasuntsuakgaixo bezala (birusaren eramaile direla) ematen ditu (madarikazioa!!!). Hau da, pertsona osasuntsueigaixo daudela esaten die.

Aitor arrisku minimo honetaz ohartzen denean, Donostian, bera bizi den hirian, HIESaren eraginariburuz agerturiko estatistiken artean ikertzen hasten da eta hiriko 150.000 hiritarretatik antigorputzeneramaileak 1.000 bakarrik direla irakurtzen du.

Hainbeste Estatistika/estatistiken ondoren, Aitorrek, analisietan positiboa eman ondoren, antigorpu-tzen eramailea izatearen probabilitatea zein den jakin nahi du. Hau da, berak, benetan eramailea izatekodaukan probabilitatea ezagutu nahi du. Garbi dago frogak eramaile dela esan diola, baina baita ere garbidago frogaren emaitza ez dela beti egiazkoa.

Aitorrekin kalkuluak egingo ditugu, dauden arrisku-talde posibleak kontuan izan gabe, ...

8

Page 21: Estatistika teoria eta praktika SPSSWIN erabiliz

Aitorrek honela arrazoitzen du.

Donostian, estatistiken arabera, 149.000 pertsona ez dira antigorputzen eramaile, 1.000 pertsonaeramaileak diren bitartean.

Antigorputzen eramaileak EZ diren 149.000 horiek froga hau pasako balute 1.490ek (% 1ek) positiboaemango zuketen. Eramaileak BAI diren 1.000 pertsonek analisia egingo balute 995ek (% 99.5ek)positiboa emango zuketen. Taulan ikus dezakegu zenbakien laburpena.

Positiboa Negatiboa

OSASUNTSUAK

149.0001.490 147.510

GAIXOAK

1.000995 5

Beraz, positibo bezala emango lukete: 1.490+995=2.485 pertsona. Hauetatik, 995 baino ez diraHIESaren antigorputzen eramaileak direnak. Benetako positiboak, alegia. Argi dago 1.490 positibo faltsudaudela (analisi positiboa ematen duten pertsona osasuntsuak) hau da, positibo guztien % 59.96 akatsakedo erroreak dira (1.490/2.485).

Aitorri ateratzen zaizkion emaitzez gain, egoerak ez du batere graziarik. Baina garbi dago datuhauekin, nahiz eta frogaren emaitza positiboa izan, HIESa ez edukitzea (% 59.6), edukitzea baino (%40.04) errezagoa dela.

Adibide honetan estatistikak, probabilitate-teoriekin portzentaiak ikusten laguntzeaz gain, Donostiakoseropositiboen kopurua zehazten lagunduko digu. Era berean, Aitorrek egindako frogaren Sentsibilitateaeta Zehaztasuna kalkulatzen lagunduko digu.

Kontzeptu hauei lotuta IRAGARPEN BALIO POSITIBOA eta NEGATIBOA daude. Iragarpen baliopositibo bezala, testean positibo eman duten guztien artean gaixorik daudenen portzentaia definitukodugu. Eta Iragarpen balio negatibo bezala, emaitza negatiboa izan duten guztien artean pertsonaosasuntsuen portzentaia (gogora dezagun emaitza positiboak infekzioa, gaixotasuna... adierazten duela,negatiboak, infekzio edo gaixotasunik eza adierazten duen bezala).

Estatistikaren arrisku, gezur eta erabilera kaxkarrak azalduz jarrai daiteke, baina ez da hau liburuhonen helburua.

Helburuen barnean, nagusia dena, metodologia estatistikoaren kontzeptu, oinarri, teknika, e.a.. aur-keztea da. Honela, hauek ezagutuz, modu zehatz batean erabiltzeko gai izan zaitezen eta, era berean,bizitzaren edozein egoeratan besteek aurkezten dizkizuten emaitzak era kritiko batean azaltzeko gai izanzaitezen. Eta halako egoerak asko direla garbi gera dadila...

1.2. ESTATISTIKAREN KOKAPENA (ikerketa baten barnean)

Estatistikarekin lan egiterakoan, testuinguru orokor bateko datuekin egingo ditugu gure lanak. Datu hauek,era berean, Giza Zientzien eremuan, Ikerketa Zientifikoen prozesuen barnean kokatuko dugun ikerketa--lan baten barruan egongo dira.

Ikerketa Zientifikoaz hitz egiten dugunean, Ezagupen Zientifikoaren lorpen-prozesua inplikatua dago.

9Estatistika: oinarrizko kontzeptuak

Page 22: Estatistika teoria eta praktika SPSSWIN erabiliz

Metodo Zientifikoa ezagupen zientifikoaren bereizgarria da eta egileen arabera, ezagupen arruntetikbereizten duena da. Mota honetako baieztapenekin ados gaude: “Metodo zientifikorik ez dagoen lekuanez dago zientziarik”. “Ikerketa zientifikoa metodo zientifikoa aplikatzeko ekintza da”,... Halere, onargarrieta erabilgarri den bakarra “zientifikoa” dela, astakeria litzateke, beste ezagupen batzuk ere osogarrantzitsuak baitira.

Ez gara metodo zientifiko ezberdinen existentziarik ba ote den ala ez-en eztabaida epistemologikoansartuko. Gu eta gu gauden testuinguruagatik, Metodo Zientifikoaz jardutean Metodo Hipotetiko-Deduk-tiboaz arituko gara. Prozesu orokorra honakoa da: ikertzaileak errealitatea behatzen du eta kasu zehatzaskoren egiaztapenetik eta teoriaren ezagupenetik abiatuz, ikerketa-hipotesiak adierazten dira. Behin hi-potesi hauek frogatu ondoren, ondorioak aterako dira, hauek era berean inplikazio teorikoak ondoriozta-tzen lagunduko dutelarik.

Metodo zientifikoaren faseak, modu eskematikoan, hauek dira:

1.- Arazoaren planteamendua. Ikerketa hasteko garaian, ikertu nahi den arazoaren definizio eta hau-taketan zentratu behar da. Ezagupenaren hutsune bat betetzea, aurreko ikerketetako kontraesanakargitzea, edota fenomeno berriren bat behatzea, ikerketa-arazo berrien planteamenduen iturri izandaitezke.

2.- Bibliografiaren azterketa. Ikerketa-arazoa definitu ondoren, hurrengo pausoa gaiari buruzkoliteraturaren azterketa zehatza egitea izango da. Gure gaiari buruz idatzi edota esan dena ezagutzeagarrantzitsua da.

3.- Hipotesiaren formulazioa. Gure aurreezagupenetan, hala nola bibliografiaren azterketan, oinarrituzproposizio edo usteak osatuko dira, edo zenbait fenomenoren gertaera posible edo ezinezkoenazalpenetan pentsatzen hasiko da, edo aldagai zehatzen erlazioaz... Ongi arrazoituak egon behardutela kontuan izanik, hipotesiek kontrastagarriak izan behar dute. Hau da, bere egiazkotasuna, edoez, azaltzea posible izan behar da. Hau izango da gure ikerketaren ahalegina: menturatu dugunhipotesiaren egiazkotasun edo faltsutasuna adierazten saiatzea.

4.- Datu-bilketaren metodologia. Planteatu diren hipotesien egiazkotasuna edo faltsutasuna frogatu behardela gogoan izanda, datu-bilketaren metodologia erabaki behar da. Fase honetan hartzen direnerabakiak, lanaren diseinu estatistikorako erabakigarriak izango dira. Puntu honetan, ezinbestean,errealitatera hurbiltzeko era bat hautatu behar da, hau da, esaten den bezala, paradigma baten barruankokatu beharko gara.

Estatistikaren berezko kokapena paradigma koantitatiboaren barnean dela baieztatu ondoren, atalhonetan hartuko diren erabakiek bai aldagaien definizioaren formari buruz, bai subjektuen laginketariburuz, bai diseinu esperimentalari eta datu-bilketaren prozedurari buruz, hauek guztiek ikerketakohipotesia frogatu/baztertu ahal izateko, beharrezko analisi estatistikoak BALDINTZATU eta ZEHAZ-TUKO dituztela kontuan eduki beharko da, batez ere erabaki bakoitzaren garrantziaz ohartzeko.

5.- Datuen analisia. Helburua datuen antolaketa eta hauen erabilpena da. Tradizionalki, hemen kokatzendugu estatistika. Dena den, aurreko atal guztiak gogoan izatearen garrantziaz jabetu behar da, lehenesan bezala, horiek izango baitira, fase honetan egingo diren analisi estatistikoak zehaztu edo baldin-tzatuko dituztenak.

6.- Ondorio eta inplikazioak. Gure datuak aztertuta, eta emaitzak abiapuntuko testuinguru teorikoanbarneratu ondoren, aipatutako emaitzen laburpena egitera joko da, ikerketa-hipotesiak onartu edobaztertzearekin batera. Beste hipotesiekiko ezadostasunak edo bat etortzeak aztertuko dira eta teoriaeta praktikarako inplikazio posibleak planteatuko dira, azkenik, etorkizuneko ikerketetarakoiradokizunak egiteko.

Baina zein da estatistikarentzat lekurik egokiena prozesu honetan guztian? Badira idazle batzuk,betekizun hau datu-bilketa eta hauen analisira murrizten dutenak. Estatistikaren papera, zeharka bada ere,prozesu osoan bertan izan behar duela ziurtatzera ausartzen naiz ni.

10

Page 23: Estatistika teoria eta praktika SPSSWIN erabiliz

Aurrekoa esan eta gero, garrantzi handiena duten bi paperak honako hauek direla ere esan dezakegu:

.– Datuen bilketa, antolaketa, deskribapena eta laburpena.

.– Hipotesien orokortzea eta kontrastea.

Garbi izan behar dugu, ezin garela estatistikaz ikerketa-fase hauetan bakarrik gogoratu, ziur askiberandu izango baita tresna honi ahalik eta etekinik handiena ateratzeko. Estatistika, arazoaren hasierakoplanteamendutik present izan behar da eta ondorioak modu egoki eta finean atera eta emaitzenaurkezpen egokia eginaz amaitu behar da.

Guretzat ezinbestekoa da Estatistika testuinguru honetan kokatzea.

1.3. OINARRIZKO BEREIZKETA ESTATISTIKAN

Estatistikari buruz hitz egitean, kontzeptu-mailan, bi arlo handi bereiztu behar ditugu:

ESTATISTIKA DESKRIBATZAILEA

ESTATISTIKA INFERENTZIALA

Estatistika deskribatzaileak, elementu-multzo bati dagozkion datuak bildu, eratu, laburtu etadeskribatzea du helburu.

Estatistika inferentzialak, lagin batean lortutako emaitzak ikertuko den populaziora orokortzea duhelburu. Orokorpen hau egiteko probabilitatearen teoria erabiltzea beharrezkoa izango da.

Bien arteko ezberdintasuna garbia da, hauteskundeetako inkesten adibidea hartzen badugu.Hauteskundeen aurretik eginiko galdeketa guztiak estatistika inferentzialaren barruan sartuko lirateke,hauteskundeen hurrengo egunean aztertutako emaitzak, estatistika deskribatzailearen barruan sartukogenituzkeen bitartean.

Estatistika deskribatzaileaz ari garenean, azterketa-gai diren elementu guztien datuak edukitzekoegoeran gaude. Estatistika inferentzialaz ari garenean, berriz, ez da hau gertatzen. Ondorioz, beti POPU-LAZIOA eta LAGINA bereiztu beharko ditugu.

POPULAZIOA elementu-multzoa da, zeinen ezaugarriren bat edo beste ezagutu nahi den: EuskalAutonomi Erkidegoko O.H.O.ko ikasleak, azken 10 urteetan eginiko kotxeak,... Populazioaren elementuguztietara heldu ezin denez, metodo egokien bitartez, elementu zehatzak hautatuko dira, populazioosoko elementuak ordezkatuko dituztenak izanik; LAGINA osatuko dutenak izango dira. Honela,adibidez, Euskal Autonomi Erkidegoan banatuak dauden O.H.O.ko 6 ikastetxeetako ikasleak edo Espai-niako 2 probintziatan azken 10 urteetan matrikulatutako marka zehatz bateko kotxeak hautatuko dira,...Lagina aukeratzeko orduan bilatzen den (edo bilatzea komeni den) oinarrizko helburua, adierazgarri-tasuna lortzea da. Hau da, laginean lortuko ditugun emaitzak ikertutako populazio osoaren emaitzekinbat etortzea.

Populazioan lortu nahi den benetako balioa PARAMETRO izenarekin ezagutzen da. Hautatzen denlaginaren ezaugarriaren balio bat lortuko dugu guk. Lortutako emaitza honi ESTATISTIKOA deituko diogu.

Bidezkoa denez, helburua, emaitza estatistikoa populazioan ezaugarri horrek duen benetako balioariahalik eta gehien gerturatzea izango da, hau da, parametroari ahalik eta gehien hurbiltzea.

Hala ere, laginekin dihardugunez, akats edo errore-tarteak izango dira. Errore horien jatorria, laginaelementu horiez eta ez beste batzuez osatuta dagoelako da. Laginak metodo aleatorioak jarraituzaukeratu diren kasuetan, erroreak, probabilitate-terminoetan kontrolatzea posible da. Aurrerago ikusikodugun bezala, laginaren tamaina handitzen den neurrian, erroreak gutxitu egingo dira.

11Estatistika: oinarrizko kontzeptuak

Page 24: Estatistika teoria eta praktika SPSSWIN erabiliz

1.4. NEURKETA

Estatistikaren edozein definiziotan “datuak” aurkitzen dira. Hauek estatistikaren ezinbesteko elementuaztergarriak dira.

Hau dela eta aztertu behar den lehenengo puntua datu-lorpena da, hots, neurketa2.

Neurketa, arau batzuen arabera elementuei zenbakiak esleitzearen prozesu orokorra bezala ulertukoda.

Arestian ikusitako zalantzazko kasuek ikustarazten dute elementuei edo hauen ezaugarriei zenbakiakesleitzea prozesu oso zabala dela. Batzuetan zenbaki hauek atributu-kopuruak adieraziko dituzte(adibidez: pisua, taila, froga baten emaitzak ...), eta beste batzuetan, berriz, kopurua adierazten ez dutenetiketak izango dira (adibidez: sexu bakoitzari, edo zona geografiko bakoitzari, edo txanpon bat airerabotatzerakoan kurutx edo pil ateratzearen gertakariari zenbaki bat esleitzea). Azken gertakari hau daautoreak prozesu orokor hau DATAZIO bezala izendatzera motibatzen dituena.

Neurketa terminoa elementuen ezaugarri edo propietateren baten kopuruen estimazio koantitatiboakegiten diren kasuetan erabiltzeko uzten da.

Edozein kasutan, NEURTZEA ezaugarri baten modalitate bakoitzari zenbakiak egokitzearen prozesuadela onar dezakegu.

Bi oinarrizko ezaugarri daude neurketaren inguruan beti kontuan edukitzea oso garrantzitsuakdirenak: FIDAGARRITASUNA eta BALIOZKOTASUNA.

Neurketa batek FIDAGARRIA dela esaten dugu, neurtzen den bakoitzean emaitza berdina edo osoantzekoa ematen duenean. Neurketa fidagarriak dira neurketa estandarrerako tresnekin egiten ditugunak:tenperatura neurtzeko termometroa, pisurako baskula,... Eta fidagarritasunik gabekoak izan daitezkeadibidez galderei erantzuten dien pertsonaren momentuko egoera animikoan eragin ditzaketen neurketa--tresnak. Argi dago zenbat eta handiagoa izan akats aleatorioa orduan eta txikiagoa izango delafidagarritasuna. Aldagai baten baliozkotasuna, zeina fidagarritasunarekin oso lotuta dagoen, ezaugarribatean egiten ditugun neurketa errepikatuen seriearen desbideratze tipikoa izendatzen dugunagatikdetermina daiteke.

BALIOZKOTASUNA, berriz, errepresentatzen saiatzen den egoeraz egiazki errepresentatzen duenmaila bezala defini dezakegu. Oso lotuta dago azterketaren barne- eta kanpo-baliozkotasunarekin.Neurketa bat hainbat eta baliozkoagoa izango da, behatzailea, neurketa-tresna edo behatutako elemen-tuetatik sortuak izan daitezkeen akats sistematikoak txikiagoak diren heinean.

Fidagarritasunaren eta baliozkotasunaren arteko diferentzia ikusteko, ikus dezagun hurrengo adibidea,non bi kontzeptuak aztertzen diren diana batean egin diren tiroekin erlazionatuz.

12

2 Azken urte hauetan idazle askok, hitz hau erabili beharrean, datazio hitza erabili dute. Hala ere, liburu honen testuinguruan,neurketa hitza egokiagoa dela uste dut.

FIDAGARITASUN handia

BALIOZKOTASUN txikia

FIDAGARRITASUN txikia

BALIOZKOTASUN handia

FIDAGARRITASUN handia

BALIOZKOTASUN handia

FIDAGARRITASUN txikia

BALIOZKOTASUN txikia

Page 25: Estatistika teoria eta praktika SPSSWIN erabiliz

Lehenengo kasuan, FIDAGARRITASUN HANDIA eta BALIOZKOTASUN TXIKIA dagoela ikus daiteke;hau da, tiro ezberdinak oso hurbil daudela, baina denak gaizki zuzenduak: baliozkotasun txikia (akatssistematikoa).

Bigarren kasuan badirudi tiroak erdiratuak daudela: fidagarritasun txikia, baina baliozkotasun handiadute: tiro ezberdinen artean aldakortasun handia dago.

Hirugarren kasua: fidagarritasun handia eta baliozkotasun handia.

Laugarren kasua: fidagarritasun txikia eta baliozkotasun txikia. Akats sistematikoak daude, tiro guztiakezkerretara desbideratuak daude, oso aldakorrak izatearekin batera.

Hemen baliokidetzat hartu ditugu tiroa eta elementuen ezaugarriei zenbakiak egokitzearen prozesua.Baina zenbakiak egokitzearen prozesu honek pauta edo arauren bat jarraitu behar du, zeini NEURKETA--ESKALA deritzogun.

1.4.1. Neurketa-eskalak

Neurketa-eskala elementu ezberdinei eta hauek dituzten elementu-kopuruen arabera zenbaki ezberdinakegokitzea ahalbidetzen duen tresna da.

Eskala hauek ezberdinak izango dira neurtu nahi diren aldagaiak edo ezaugarriak ezberdinak direnneurrian. Honela, eskala ezberdinak erabiliko dira pisua, altuera, adina, sexua edo jatorrizko populazioaneurtzeko. Honen arabera neurketa-eskalen sailkapena egingo da.

1.4.2. Neurketa-eskalen sailkapena

Guri dagokigun testuinguruan, neurketa-eskalak lau mota funtsezkoetan zatituko dira: nominalak,ordinalak, tartekakoak eta arrazoizkoak.

1.- Eskala NOMINALA edo kategorikoa. Guztietatik oinarrizkoena da. Zenbakiak kategoriak izendatzekoerabiltzen dira. Hau da, berezko baloreak baino kategoriak identifikatzea ahalbidetzen duten etiketakdira. Honela sexu-kategoriak balore hauekin izenda daitezke 1: gizonezkoa eta 2: emakumezkoa. Edobalore ezberdinekin izenda daitezke probintzia edo herrialde ezberdinetako pertsonak. Argi dago,zenbakiek ez dituztela kopuruak adierazten.

Eskala nominala ondo definitua egon dadin bi baldintza bete behar ditu:

a.- OSOTASUNA: elementu guztiek kategoriaren batean egon behar dute. Ezin da elementurik sailkatugabe gelditu.

b.- BAZTERTZAILEA: elementu bakoitza kategoria bakar batean sar daiteke. Ezin zaizkio elementu batibi balore ezberdin egokitu. Edo berdina dena, elementu bat ezin da kategoria batean bainogehiagotan egon.

2.- Eskala ORDINALA. Nominala baino maila altuagokoa da. Kasu honetan zenbakiek elementuen orde-nazioa adierazten dute. Adibide tipikoak izan daitezke: txirrindulari batzuk karrera zein ordenatanbukatzen duten, edo pertsona bati bere lehentasun edo ematen dion garrantziaren arabera produktubatzuk ordena ditzala eskatzea; bizitza harmoniko baterako hiru gauza garrantzitsuenak zehaztea,...Mota honetako eskalak erabiltzen dira produktu baten ezaugarrietarako nahiera- edo nahigabe-mailagaldetzeko.

Hau ere, eskala ordinalaren adibide da: inkesta pasatzen zaion pertsonari grafiko bat aurkezten zaioeta behin produktua probatu ondoren somatu duen inpresioari hobeto egokitzen zaion marrazkiangurutze bat jar dezan eskatzen zaio.

13Estatistika: oinarrizko kontzeptuak

Page 26: Estatistika teoria eta praktika SPSSWIN erabiliz

Eskala ordinal tipiko bat da. Laukitxoei 7tik 1erako (ezkerretik eskuinera) baloreak egokitzen zaizkioedo baliokide den +3tik -3ra, 0 erdiko laukitxoarentzat uzten delarik (7 edo +3 onargarrienari ematenzaio eta 1 edo -3 baztergarrienari).

3.- TARTEKAKO eskala. Kontsidera dezagun gaurko tenperatura. Zenbakizko kopuru baten bitartezadierazten dugu, 27 gradu, 15 gradu edo 30 gradu. Baina 30 gradu ez da 15 graduen bero bikoitza.Hau ohizko tartekako eskala da. 0 konbenioz ezarri den puntu arbitrarioa da, 0 graduk ez du esannahi 0 bero egiten duenik (arrazoizko eskaletan ez da hau gertatuko). Hau da, 0k ez du bero-ausentziatotala adierazi nahi (edo kasu honetan hotza). Beste adibide bat gaurko egutegia da. Gure garaiko 0urtea esaten dugunean, ez dugu esan nahi lehendik ezer ez zegoenik, 0 urtea (balorea) hemen erearbitrarioa da.

4.- ARRAZOIZKO eskala. Tartekako eskala da, non 0 absolutua den, hau da, kasu honetan bai adieraztenduela atributuaren ausentzia. Adibidez pisua; 0 kilo pisatzen baditu ez du pisurik. 300 pezeta baldinbaditu 300 ditu, eta eskala hau ezaugarritzen duena: 0 pezeta baditu ez du dirurik.

Baina kontuz!, bai arrazoizko baita tartekako eskaletan ere neurketa-eskala ezberdinak erabildaitezke. Honela tenperatura neurtzeko gradu zentigraduak, Kelvin-ak edo Fahrenheit-ak erabildaitezke (baina denak tartekakoak dira). Eta pisua neurtzeko gramoak, kiloak, arroak edo liberak,erabil daitezke, baina denak arrazoizkoak dira eta baliokidetasunak ezar daitezke beraien artean.

1.5. ALDAGAIAK

Aurreko ataletan zenbait ezaugarri neurtzeaz hitz egin da. Neurketaren emaitza ezaugarrienmodalitateetara erantsi diren zenbaki batzuk izango dira. Hasteko, ezaugarri hauek, neurtu ahal izateko,elementu batetik beste batera aldatu behar dira, beraz ez dira iraunkorrak, ez dira konstanteak:ALDAGAIAK dira. Hauek dira Gizarte Zientzien azterketaren objektua osatuko dutenak, propioak dituenaldagaien azterketa.

Hemendik aurrera, elementu batetik bestera aldatzen diren ezaugarriekin egingo da lan, hau daALDAGAIEKIN. Eta hauek izendatzeko era honetako hizkiak erabiliko dira: X, Y, Z,... Eta i eta jelementuek, X eta Y aldagaietan dituzten balore zehatzak era honetara izendatuko dira: Xi, Xj, Yi eta Yj.

Erabili den neurketa-eskalaren arabera, aldagai-mota ezberdinei buruz hitz egiten arituko gara.Aldagai-mota ezberdinez hitz egingo da:

.– KOANTITATIBOAK: arrazoi edo tartekako eskala bat neurtzeko erabili da.

.– ORDINALAK: eskala ordinal bat erabili da.

.– KOALITATIBOAK: eskala nominal bat erabili da.

Aldagai koalitatiboen barnean, bere garrantzia dela eta, aldagai DIKOTOMIKOEK, bi kategoriabakarrik dituztenak, atentzio berezia merezi dute. Adibide tipikoak sexua eta ezaugarri bat edukitzea edoez edukitzea dira. Zenbait kasutan, DIKOTOMIZATURIKO aldagaiez hitz egingo da, jatorriz bi kategoria

14

Page 27: Estatistika teoria eta praktika SPSSWIN erabiliz

baino gehiago izanik bitara murriztu diren aldagaiei erreferentzia egiten dietenak. Adibide tipikoa ikasgaibateko notak gainditu eta ez gaindituetara murriztea izan daiteke.

Ezaugarriak, berez, ez dira ez koantitatiboak, ez ordinalak ezta koalitatiboak ere. Neurtzeko erabiliden eskalaren araberakoa izango da. Adibidez, altuera koantitatiboa izango da metroa erabili baldin badabaina subjektuak altu, normal eta baxuetan sailkatzen badira eskala ordinala izango da. Denborarekinberdin gertatuko da. Korrikalariak helmugara iritsi diren ordena kontuan izaten bada ordinala izango da,baina korrika egiteko erabili duten denbora kontuan hartzen bada froga koantitatiboa izango da.

Azkenik, ikerketa planteatzeko orduan ezaugarri zehatz bat neurtzeko erabili nahi/ahal den eskala--mota zehaztea garrantzitsua dela adierazi nahi dut, erabiliko den eskala-motak neurketaren kalitatean etaera berean, egingo diren analisi estatistikoetan eragina izango baitu.

15Estatistika: oinarrizko kontzeptuak

Page 28: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 29: Estatistika teoria eta praktika SPSSWIN erabiliz

2. ALDAGAI BATEN ESTATISTIKA DESKRIBATZAILEA. DATUEN ANTOLAKETA ETAAURKEZPENA

2.1. MAIZTASUNEN BANAKETA

2.1.1. Maiztasunen banaketa baten eraketa, aldagai koantitatiboekin

2.1.1.1. Tarteen mugak

2.2. ADIERAZPEN GRAFIKOAK

2.2.1. Barra-diagrama

2.2.2. Sektoreak

2.2.3. Piktograma

2.2.4. Histograma

2.2.5. Maiztasun-poligonoa

2.2.6. Kaxa-diagrama

2.2.7. Irudikapen grafikoetarako arauak

2.2.8. Grafiko engainagarriak

2.2.9. Adar eta orrien diagrama

2.3. MAIZTASUN-BANAKETA PROPIETATEAK

2.3.1. Joera zentraleko neurriak (indizeak)

2.3.1.1. Batezbesteko arimetikoa

2.3.1.1.1. Batezbestekoaren ezaugarriak

2.3.1.2. Mediana

2.3.1.3. Moda

2.3.1.4. Joera zentraleko zein neurri erabili behar dut?

2.3.2. Banakako posizioko neurriak (indizeak)

2.3.2.1. Pertzentilak

2.3.2.2. Kalkulu-prozesua. Aldagai diskretuak eta tartekakoak

2.3.3. Aldakortasun- edo sakabanatze-neurriak (indizeak)

2.3.3.1. Heina

2.3.3.2. Bariantza eta desbideratze tipikoa

2.3.3.2.1. Bariantza eta desbideratze tipikoaren kalkulu eta ezaugarriak

2.3.3.3. Aldakuntza-koefizientea

2.3.3.4. Koartilarteko ibiltarterdia

2.3.3.5. Kaxa-diagrama: aldakortasunaren irudikapena

2.3.4. Formari buruzko indizeak: asimetria eta kurtosia

2.4. SPSSWIN-EN EMAITZAK

2.5. ADIBIDE OROKOR BAT

2.6. ARIKETAK: ESTATISTIKA DESKRIBATZAILEA

Page 30: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 31: Estatistika teoria eta praktika SPSSWIN erabiliz

19

2. ALDAGAI BATEN ESTATISTIKA DESKRIBATZAILEA. DATUEN ANTOLAKETA ETAAURKEZPENA

Aldagaien neurketa-prozesua amaitu ondoren, ezaugarri zehatzetan neurtu diren pertsonen edotaelementuen datu-multzoarekin egiten dugu topo. Aldagai batzuei dagozkien datuak dira. Hauek, datuak,aztertu nahi dira.

Beraz, datu hauek begiratzen hasteko unea da.

Gutxi direnean, ematen duten informazioaz ohartzeko, begizko azterketa egitea aski izango da. Bainabildutako datuen kopurua handia denean, datu hauek antolatuz hasi beharko da, ondoren, datu-multzohau hobeto ezagutzen edota ikusten lagunduko duten indize zehatzak lortzeko. Baina, aurkeztu ere eginbehar dira, modu argi eta ulerkorrean, eta horretarako grafikoez baliatuko gara.

Hauek izango dira gai honetan jorratuko diren atal garrantzitsuenak.

Gai osoan zehar, SPSSWINekin lortutako emaitzen adibideak tartekatuko dira. Hauek lortzeko moduanahiz irakurtzeko/interpretatzeko arauak adieraziko dira bertan. Baina emaitzak lortu aurretik, hitzaurreanaipatutako Web orrialdean aurki dezakezun LIBURUA.SAV izeneko datu-fitxategia irekia duzulapentsatuko dut.

Has gaitezen gure datuak antolatzen. Honetarako, oinarrizko era bat Maiztasunen Banaketa da.

2.1. MAIZTASUNEN BANAKETA

Bildutako datuak antolatzeko, eta behar den moduan ordenatu eta aurkezteko, edo adierazpen grafikoakegiteko, edo behar den informazioa eskaintzeko, edo indize estatistikoen kalkulua errazteko..., Banaketahauek erabiliko dira.

Aldagaiez hitz egitean, eta ezaugarri zehatz bati buruzko burutapenak kontatzean, ondorengokoadroan definitzen diren maiztasun-motak erabiltzen dira:

Aurreko gaian aipatu den bezala, Xi hizkiak erabiliko dira, X aldagaiaren balio zehatza adierazteko.

Xi balioa gure laginean errepikatzen den kopuruari Maiztasun absolutua deritzogu, eta ni bezalaadieraziko dugu.

Xi balio baten Maiztasun erlatiboa, pi bezala adieraziko duguna, Xi balioaren maiztasun absolutua(ni), zati laginaren tamaina (N) eginaz lortuko dugu. Honela:

pi = ni / N

Pi portzentaia, maiztasun erlatiboa bider 100 eginaz lortuko dugu.

Pi = pi * 100

Xi balio baten Maiztasun absolutu metatua izendatzen dugu, eta na bezala adieraziko dugu Xibalioa edo bere aurrekoak/txikiagokoak agertzen diren aldi kopurua.

Maiztasun absolutu metatua na, zati laginaren tamaina (N) eginaz lortuko dugun emaitza, Xi baliobaten Maiztasun erlatibo metatua izango da, eta pa bezala adieraziko dugu,

pa = na / N

Page 32: Estatistika teoria eta praktika SPSSWIN erabiliz

20

Pa: Portzentaia metatua = Maiztasun erlatibo metatua bider 100 eginaz lortuko dugu.

Pa = pa * 100

Has gaitezen kasu bat aztertzen. Ondoren aurkezten duguna irakasgai honen antzeko bateanmatrikulatutako 90 ikaslek lortu dituzten noten maiztasunen banaketa izango da.

Oinarrizko taula era honetakoa da. Bertan Xi-k notak ordezkatzen ditu eta ni-k, berriz, notabakoitzaren maiztasuna, hau da nota bakoitza agertzen den aldien kopurua.

Xi ni

2 2

3 7

4 14

5 21

6 16

7 12

8 9

9 8

10 1

90

Aurreko taula osatu egingo dugu maiztasun metatua (na), maiztasun erlatibo absolutua (pi) eta metatua(pa) erantsiz: lehen eman ditugun, na, pi, eta pa-ren definizioak baieztatzeko aukera daukazu.

Xi ni na pi=ni/N pa=na/N

2 2 2 .022 .022

3 7 9 .077 .100

4 14 23 .155 .255

5 21 44 .233 .488

6 16 60 .177 .666

7 12 72 .133 .800

8 9 81 .100 .900

9 8 89 .088 .988

10 1 90 .011 1.000

N=90 1.000

Ikus dezagun ondoren, datu hauek berak, SPSSWIN paketeak nola aurkezten dituen.

Emaitzen koadroan, aldagai koantitatiboaren izena, NOTAK, agertu ondoren, Value-ren zutabean, ikusdaitekeen bezala, aldagaiaren balio ezberdinak aurkezten ditu. Segidan, Frequency-ren zutabean,maiztasun absolutuak eta Percent-en zutabean (kasu honetan Valid Percent-ekin bat datorrena)portzentaia borobilduak azaltzen dira. Goiko taulako maiztasun erlatibo absolutuaren balioarekin edoprobabilitatearekin, pi-rekin, bat egiten dutela ikus daiteke, baina hemen bider 100 eginda. Eskuinekozutabean portzentaia metatuak eta borobilduak azaltzen dira, era berean maiztasun erlatibo metatuekinedo probabilitate metatuekin bat datozela.

Page 33: Estatistika teoria eta praktika SPSSWIN erabiliz

SPSSWIN 6.1.3

NOTAK

Valid Cum

Value Label Value Frequency Percent Percent Percent

2,00 2 2,2 2,2 2,2

3,00 7 7,8 7,8 10,0

4,00 14 15,6 15,6 25,6

5,00 21 23,3 23,3 48,9

6,00 16 17,8 17,8 66,7

7,00 12 13,3 13,3 80,0

8,00 9 10,0 10,0 90,0

9,00 8 8,9 8,9 98,9

10,00 1 1,1 1,1 00,0

———- ———- ———-

Total 90 100,0 100,0

Valid cases 90 Missing cases 0

7.5 bertsioak, berriz, emaitza berak bi zatitan eskaintzen ditu; lehenengoan kasu edo elementubaliagarrien kopurua (Valid) 90 dela adierazten du, eta galduak (Missing) 0. Segidan, aurreko taularenantzeko bat aurkezten du. Kasuen eta kasu baliagarrien arteko diferentzia garrantzi handikoa izango da.Batzuetan gauza bera izango da, beste batzuetan ez. Suposa dezagun 25 ikaslez osatutako gela batean 5ezaugarri neurtu direla. Kasu-kopurua 25 izango da. Baina ikasle batek, adibidez, bere jaioteguna ez baduidatzi, ikasle honen adina ezezaguna izango da. Beraz ADINA aldagaian, Valid Cases, hau da guretzakoBALIOZKOAK 24 izango lirateke eta Missing cases (datu ezezagunak) 1. Gero sakonago aztertuko dugu;hemen ohar txiki hau azaldu nahi izan dizut bakarrik.

21Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Válidos Perdidos

Estadísticos

0

N

NOTAK 90

Frecuencia PorcentajePorcentaje

válido

Porcentaje

acumulado

NOTAK

Válidos 2 2,2 2,2 2,2

7 7,8 7,8 10,0

14 15,6 15,6 25,6

21 23,3 23,3 48,9

16 17,8 17,8 66,7

12 13,3 13,3 80,0

9 10,0 10,0 90,0

8 8,9 8,9 98,9

1 1,1 1,1 100,0

90 100,0 100,0

90 100,0

2,00

3,00

4,00

5,00

6,00

7,00

8,00

9,00

10,00

Total

Total

SPSSWIN 7.5

FRECUENCIAS

Page 34: Estatistika teoria eta praktika SPSSWIN erabiliz

Sarreran aurkeztu den, eta liburu osoan zehar jarraituko den adibide orokorra berriro hartzen bada,beheko koadroan SEXUA izeneko aldagai dikotomikoaren emaitzak ikus daitezke. Emaitza haueklortzeko, SPSSWIN barruan, eta LIBURU.SAV fitxategia kargatu ondoren, honako aukerak hautatu behardira:

EstadísticosResumir

Frecuencias...

Eta ondorengo leihoan ikus daitekeen bezala, SEXUA aldagaia hautatu da. (Aceptar).

Emaitzak honako hauek izan dira:

SPSSWIN 6.1.3

SEXUA

Valid Cum

Value Label Value Frequency Percent Percent Percent

GIZONA 1 125 37,3 40,2 40,2

EMAKUMEA 2 186 55,5 59,8 100,0

0 24 7,2 Missing

———- ———- ———-

Total 335 100,0 100,0

Valid cases 311 Missing cases 24

Emaitza berak, baina 7.5 bertsioarekin lortuak, beste hauek dira:

22

311 24SEXUA

Válidos Perdidos

N

Estadísticos

SPSSWIN 7.5

FRECUENCIAS

Page 35: Estatistika teoria eta praktika SPSSWIN erabiliz

Formatoa eta estetika aldatzen dira, baina, logikoki, emaitza berak ditugu bi bertsioetan. Nahi baduzuformato biak konparatuz joan zaitezke. Nik 6.1.3 bertsiokoen ordena jarraituko dut pausoz pauso.

Ikus daitekeen bezala, ezkerreko zutabean aldagaiaren izena, SEXUA, aurkeztu ondoren, “Valuelabel” goiburuaren azpian, Gizonak eta Emakumeak balioen etiketak aurkezten dira; Gizonei 1 balioa etaEmakumeei 2 balioa eman diegu eta guztira, 125 gizonezko eta 186 emakumezko ditugu. Maiztasunhauek hurrengo zutabean ditugu, FREQUENCY/FRECUENCIA goiburuaren azpian.

MISSING/PERDIDOS (GALDUAK). Maiztasunen sailkapen honetan aurkezten dena oso egoeraerreala da. Pertsona edo elementu-talde zabal baten datu asko jasotzen denean, zenbait pertsonarendatuak ezin bildu izana maiz gerta daiteke. Adibidez, bi egun jarraian ikastetxe batera inkestak pasatzerajoan bagara, bi egun horietakoren batean egon ez diren ikasleak edukitzea posible da. Edo izena jartzekogaraian, batzuk abizenak bakarrik idatzi dituzte, edo izenaren iniziala, edo izena irakurtzean ez dago osogarbi emakumezkoa edo gizonezkoa den,... Zenbait pertsonaren aldagai zehatzei buruzko datuen faltaeragin dezaketen egoera ugari dago. Kasu hauetan, aldagaiagatik onartuak izango ez diren eta galdutzatemango diren datuak erakusteko balio bat erabiliko da; balio hau “Missing cases” edo “Perdidos” izenezadieraziko da.

Kasu honetan, hirugarren lerroan aurkitzen den 0 balioak azaltzen du egoera hori. Sexuaz identifikatuezin diren 24 pertsona ditugu. Horregatik, 311 pertsonen datuekin lan egingo dugu. Beraz, kasu honetanVALID CASES, baliozko kasuak, 311 izango dira.

PERCENT/PORCENTAJE (PORTZENTAIA). Hurrengo zutabean, Portzentaia etiketaren azpian maizta-sun erlatiboak azaltzen dira, baina bider 100 eginda. Hau da, balio bakoitzaren maiztasuna pertso-na-kopuru osoagatik (335) zatitzen du eta bider 100 egiten du. Zuk, irakurle, emaitzak egiazta ditzakezu.

VALID PERCENT/PORCENTAJE VALIDO (BALIOZKO PORTZENTAIA). MISSING edo balio galduakditugunean portzentaiak jakiteko, begiratu behar dugun zutabea da. Aurreko zutabean ez bezala(Percent), non laginaren tamaina bezala 335 lagun hartu dituen, zutabe honetan kalkuluak egitekogaraian, ezagutzen direnak bakarrik hartuko ditu BALIOZKO bezala. Hau da, 125 gizonezko eta 186emakumezko: guztira 311 pertsona. Ez ditu kontuan hartzen galduta edo “missing” dauden 24 kasuak.Horrela, gizonezkoen Valid Percent-a lortzen du: 125/311. Aurreko zutabean bezalaxe maiztasunerlatiboak portzentaietan aurkezten ditu, hau da, bider 100 eginda.

CUM PERCENT/PORCENTAJE ACUMULADO (PORTZENTAIA METATUA). Portzentaia metatuakdira. Ez dago gehiago esan beharrik. Erraza da.

Eta beste adibide bat.

Hurrengo taulan, AITAIKAS: AITAREN IKASKETA-MAILA izeneko aldagai ordinalaren maiztasunenbanaketa aurkezten da.

23Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

125 37,3 40,2 40,2

186 55,5 59,8 100,0

311 92,8 100,0

24 7,2

24 7,2

335 100,0

GIZONA

EMAKUMEA

Total

Válidos

0

Total

Perdidos

Total

Frecuencia PorcentajePorcentaje

válido

Porcentaje

acumulado

SEXUA

Page 36: Estatistika teoria eta praktika SPSSWIN erabiliz

AITAIKAS AITAREN IKASKETA-MAILA

Valid Cum

Value Label Value Frequency Percent Percent Percent

GOI MAILAKOAK: UNIBE 1 37 11,0 11,4 11,4

ERDI MAILAKOAK 2 47 14,0 14,5 25,8

BIGARREN HEZKUNTZAKO 3 85 25,4 26,2 52,0

LEHEN HEZKUNTZA (OHO 4 127 37,9 39,1 91,1

IKASKETARIK GABEA 5 29 8,7 8,9 100,0

0 10 3,0 Missing

———- ———- ———-

Total 335 100,0 100,0

Valid cases 325 Missing cases 10

Emaitza berak, baina 7.5 bertsioan, honako hauek:

Taularen formatoa aurrekoaren antzekoa da. Aldagaiaren izena, (AITAIKAS), goiburuan ipini ondoren,aldagaiaren (Value Label) maila desberdinak aurkezten ditu emaitzak: Goi-mailakoak, Erdi mailakoak....Ondoren, maila bakoitzari ezarri dizkion balioak (Value), maiztasunak (Frequency/Frecuencia), maiz-tasun erlatiboak bider 100 eginak (Percent/Porcentaje), baliozko maiztasun erlatiboak (VALID/Porcentajeválido), hau da, beren gurasoen aktibitate laborala ezagutzen dugun ikasleak bakarrik kontuan hartuzegina litzateke (325), eta azkenik baliozko portzentaia metatuak (Porcentaje acumulado).

24

325 10

AITAREN

IKASKETA--MAILA

Válidos Perdidos

N

Estadísticos

37 11,0 11,4 11,4

47 14,0 14,5 25,8

85 25,4 26,2 52,0

127 37,9 39,1 91,1

29 8,7 8,9 100,0

325 97,0 100,0

10 3,0

10 3,0

335 100,0

GOI MAILAKOAK:UNIBERTSITARIOAK

ERDI MAILAKOAK

BIGARRENHEZKUNTZAKOIKASKETAK

LEHEN HEZKUNTZA(OHO) AMAITUA

IKASKETARIKGABEA

Total

Válidos

0

Total

Perdidos

Total

Frecuencia PorcentajePorcentaje

válidoPorcentajeacumulado

AITAREN IKASKETA-MAILA

SPSSWIN 7.5

FRECUENCIAS

Page 37: Estatistika teoria eta praktika SPSSWIN erabiliz

Bertsioen artean diferentzia txikia dago. Etiketak oso luzeak direnean, 6.1 bertsioan moztu egin dituelaikusten da; 7.5 bertsioan, berriz, osorik idazten ditu, behar dituen lerroak hartuz. Batzuetan estetikokiitsusi ikusten da, baina liburuaren azken atalean ikusi ahal izango den bezala, aldatzeko aukera ematendu. Gainerantzean, emaitzak baliokideak direla egiazta daiteke.

OHARTXO BAT: SPSSWINek aurkeztutako emaitzak egiaztatzen badituzu, beti gertueneko zenbakiraborobiltzen dituela ikusiko duzu. Horrela, Goi Mailakoen Porcentaje Válido/Valid Percent-aren baliozehatza: 37/325 = 11.38 da, baina SPSSWINek eskaintzen digun emaitza 11.4 da. Modu berean, ErdiMailako Ikasketak dituzten gurasoen portzentaia: 47/325 = 14.46 da; emaitzetan 14.5 ikusten dugu.Berriro emaitza borobildu egin du.

Hurrengo zutabean, portzentaia metatuenean (CUM PERCENT/Porcentaje acumulado), bigarrenlerroan azaltzen den balioa 25.8 da. Eta ez dagokio zehazki Goi Mailako eta Erdi Mailako Ikasketenportzentaien baturari (11.4 + 14.5 = 25.9). Arrazoia berriz ere borobiltzera jo duela da. Ikus dezagun.Goi edo erdi mailako ikasketak dituzten pertsonak 84 dira 37 + 47. Dagokion portzentaia 84/325 = 25.84da eta borobilduz 25.8. Beraz, argitua. Puntu honetan trabatuta ez geratzeko ohartxo honek baliokodizula espero dut.

Aurreko kasuetan, aldagaia eskala koalitatibo batez neurtu da eta, beraz, maiztasunen taula osatzeaerraza zen. Aldiz, zenbaitetan, gure aldagaia koantitatiboa denean, zenbait arazotxorekin egin dezakegutopo. Horrela, arazo hauen deskribapena egin eta konpontzeko pausoak azalduko ditugu.

2.1.1. Maiztasunen banaketa baten eraketa, aldagai koantitatiboekin

Imajina ezazu ondorengo egoera: 2 ikasgeletako 59 haurren ikasketa-ohiturei buruz honako datuakditugu:

17 20 28 33 44 44 11 24 29 34 39 47 21 19 47 34 32 38

15 25 19 29 48 23 26 12 20 44 26 14 31 3 30 22 45 43

23 25 39 37 35 33 27 8 45 31 39 28 37 36 27 41 31 43

9 24 34 40 48

Emaitzak modu “irakurgarriago” batean aurkeztu ahal izateko, lehenik gure psikopedagogoekmaiztasunen taula bat eratzen dute. Ikus dezagun emaitza:

Xi mi Xi mi Xi mi Xi mi Xi mi

1 0 11 1 21 1 31 3 41 1

2 0 12 1 22 1 32 1 42 0

3 1 13 0 23 2 33 2 43 2

4 0 14 1 24 2 34 3 44 3

5 0 15 1 25 2 35 1 45 2

6 0 16 0 26 2 36 1 46 0

7 0 17 1 27 2 37 2 7 2

8 1 18 0 28 2 38 1 48 2

9 1 19 2 29 2 39 3

10 0 20 2 30 1 40 1

Nahiz eta saiatu, lehenengo ahalegina alferrikakoa izan da, edo gutxienez, ez dugu aurrerapausohandiegirik eman datuen irakurketa errazagoa eskaintzerakoan. Ondorioz, beste saiakera bat egingodugu.

Geure datuak tarteak deituko dugun talde edo mailetan multzokatzen saiatuko gara. Baina hasi bainolehen bi galdera hauen erantzuna jakin beharko dugu; nola eratuko ditugu tarte hauek? Nondik hasikogara?

25Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 38: Estatistika teoria eta praktika SPSSWIN erabiliz

Balio handiena eta txikiena ezagutuz hasiko gara: 48 eta 3, hurrenez hurren.

Badakigu txikienetik handienera 46ko distantzia dagoela. KONTUZ! Unitate bat gehitu behar izandiogu, aldagai koantitatiboa denez unitate bat gehiago kontatu behar baitiogu diferentziari, muturretakobalioak barnean hartzeko (konta ezazu hatzekin, adibidez, 3tik 7ra zenbat doazen, bi ertzak barnehartuta: 5 ).

Kasu honetan unitate bat gehitu behar izan dugu hamarrenik ez dagoelako, hamarrenen kasuan 0.1gehitu beharko genuke, eta bi hamarren izan ezkero 0.01,... eta horrela orokorrean. Adibidez, puntuaziotxikiena eta handiena 12.47 eta 37.55 balira, bien arteko diferentzia 25.08 litzateke. Ongi bada, distantziakalkulatzeko, ehuneneko batean gehituko dugu: 0.01, eta honekin emaitzatzat: 25.09 izango dugu.

Hemen, beste galdera bat daukagu, hain zuzen: Zenbat tarte egingo ditugu? Neurri baten barruan nahiduguna egiteko, arazo batekin topatzen gara. Zenbat kategoria edo mailatan sartuko ditugu gure datuguztiak? Ez dago erabakita. Badakigu 46ko zabalera edo anplitude osoa dugula. Luzera 5 duten 10 tarteegin ditzaket (zabalera osoa 4an zabalduaz) edo 6ko luzera duten 8 tarte, edo... Ez dago arau zehatz eztamugiezinik ere. Erabakia hartzeko garaian, hori bai, zenbait alderdi kontuan hartzen dira:

.– Goiko tarteak behatutako baliorik handiena barnean hartu behar du.

.– Beheko tarteak espero den baliorik txikiena barnean hartu behar du.

.– Emaitzak gure datuen sailkapen errealaren islada zehatzena izan behar du.

Iritzi hauei, kontuan izan behar genituzkeen beste batzuk gehi geniezazkieke. Tarteen kopuruak ez duhandiegia izan behar. Ezta zabalera handiegia eduki ere. Iritzi praktiko bezala, eta besterik ez baduzu,datu-kopuru handiegia ez baduzu, tarteen kopurua maiztasun osoaren erro karratuaren ingurukoa izateagomendatzen dugu. Horrela 60 pertsona badituzu, 8 tarte inguru era itzazu; 100 badituzu, gutxigorabehera 10, baina ez dago eredu zehatzik. Modu ezberdinak proba itzazu...

Zenbaitetan tarteak aurretik edo atzetik irekiak izatea komeniko da. Adibidez, enpresa bateko soldateiburuz ari bagara, adibidez, kategoriak era honetakoak izan daitezke:

– 100.000raino100.000 – 150.000 150.001 – 200.000200.001 – 250.000250.001 – 300.000300.001etik gora

Lehen kategoria irekia da, hau da: 100.000 pezetarainokoa, eta azkena ere berdin: 300.001 pezetatikgora irabazten dutenak. Arrazoia garbia eta erraz ulertzekoa da: elementurik gabeko tarteak gera ezdaitezen muturretan.

Gure adibidera bueltatuz, 8 tarte osatzea erabaki dugu.

Orain, tarteen luzera erabaki behar dugu. Oro har, luzera berdinekoak egingo ditugu (Hau da egin ohidena. Lehen eta azken tarteekin salbuespenak egiten dira, lehen aipatu bezala, kasu askotan irekiak uztendirelako. Baina gure kasua ez denez, berdinak egitera joko dugu). Zein izango da luzera? Hasteko, guretarteek datu guztiak hartu behar dituzte, beraz, luzera guztien baturak, aldagaiaren zabalera edo luzeraosoa, gutxienez, bete beharko du, hau da, gure datuen maila berekoa izan beharko du. Orain kontuanizango dugu 8ren (tarte kopurua) multiplorik hurbilena eta 46 baino handiagoa dena, 48 dela = 8 * 6.Beraz, gure tarteek 6ko luzera izango dute.

26

Page 39: Estatistika teoria eta praktika SPSSWIN erabiliz

2.1.1.1. Tarteen mugak

Daturik txikiena 3 da eta handiena 48.

Aldagaiak zenbakizkoak direnean bada kontuan eduki beharreko oinarrizko iritzi bat. Adibide batjarriko dut: pisuaren kasuan, adibidez, guk 64 kilo pisatzen dugula esaten dugunean, Gure BENETAKOpisua ez da justu-justu 64 kilokoa izango, baizik eta 63.500etik 64.4999ra doan tarte baten barruandagoela esaten ari gara. Gure pisua 63.6376 kilo denik ez dugu esaten, besteak beste ez bailitzateke egiaizango.

Beraz, daturik txikiena 3 dela esaten dugunean, 2’5 eta 3’5en artean dagoela esaten da eta handiena48 dela esaten dugunean, 47’5 eta 48’5en artean dagoela. Ondorioz, goiko eta beheko muga errealak2.50 eta 48.50 dira. Hau, zabaltasun osoa (handiena eta txikienaren arteko diferentzia erreala) 46koa delaikusteko beste modu bat da.

Baina geure datuak 6ko zabalera duten 8 tartetan sartuko ditugula erabaki dugunez, 8 * 6 = 48 -kozabalera osoa ematen digu. Hau da, geure tarteek 48ko zabalera izango dute, geure datuek 46koa dutenbitartean. Kasu hauetan egiten dena zera da: tarte handienaren goiko ertza eta txikienaren beheko ertzazabaldu. Horrela, goitik nahiz behetik berdin haziko dira. Gure kasuan unitate bat gehituko dugu goitiketa beste bat behetik. Beheko muga bezala: 1.5, eta goiko muga bezala 49.5 erabiliko ditugu. Honekintarteak eta muga errealak hauexek izatea lortuko dugu: 1.5-7.5 7.5-13.5 13.5-19.5 19.5-25.5 25.5-31.531.5-37.5 37.5-43.5 43.5-49.5.

Jada, maiztasunen banaketa eratzeko, tarte bakoitzean bere balioa barnean hartua duen pertsonenkopurua zenbatzea bakarrik geratzen zaigu.

Beste ohartxo bat: Batzuetan, tarteen muga errealak idatzi beharrean, eta erosoagoa delako bakarrik,errealak diren baina borobilduak dauden, itxurazko mugak idazten dira. Modu honetan idatzita sarritantopatuko dira. Kasu hauetan, tarte baten goiko mugaren eta hurrengoaren behekoaren artean salto bategongo da. Beraz, maiztasunen honako banaketa izango da:

Tarteen BENETAKO ITXURAZKO mi Xi: Klase edo

MUGAK (Errealak) mugak tarteko marka

1.5 – 7.5 2 – 7 1 4.5

7.5 – 13.5 8 – 13 4 10.5

13.5 – 19.5 14 – 19 5 16.5

19.5 – 25.5 20 – 25 10 22.5

25.5 – 31.5 26 – 31 12 28.5

31.5 – 37.5 32 – 37 10 34.5

37.5 – 43.5 38 – 43 8 40.5

43.5 – 49.5 44 – 49 9 46.5

59

Amaitzeko, gure datuekin manipulazio jakin batzuk egiteko, zenbaitetan, tartearen adierazgarri batkontuan izan beharko dugula azaltzen dizut. Balio horri KLASE edo TARTEKO MARKA deituko diogu.

Askotan, klase edo tarteko marka bezala, tarte bakoitzaren erdiko puntua hartuko da. Tarte irekienkasuan (noizean behin lehenengoa edo azkena), klase-marka bezala, tarte horren barnekoa izanik,ordezkari fidel edo zehatz bezala onar daitekeen balioa hartuko da.

27Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 40: Estatistika teoria eta praktika SPSSWIN erabiliz

2.2. ADIERAZPEN GRAFIKOAK

Adierazpen grafikoek estatistikaren ezinbesteko tresna osatzen dute eta, sarritan, beste modu batez“ikusgaitza” izango litzatekeen informazioa eskainiko dute.

Erabilpen erraza dute eta “irakurketa” ere samurra da. Aldiz, eta ziur aski ordenagailuz eraikitzea ereoso erraza delako, batzuetan, azaldu nahi den errealitatea nahasten duten irudiak eskaintzen dituztenirudikapen grafikoak topa daitezke.

Hasiera batean, gure datuen errealitatea modu fidagarrian ikusteko aukera eskaintzen duen edozeinirudikapen grafiko onargarria izan daiteke.

Adierazpen grafiko mota ugari dago. Hemen, Gizarte-zientzietan ohizkoenak diren haietan geratukogara: barra-diagrama, ziklograma edo sektore-diagrama, piktograma, histograma, maiztasunen poligonoaeta kaxa-diagrama.

Ikus dezagun eredu bakoitzaren adibide bana:

2.2.1. Barra-diagrama

Oro har, aldagai koalitatiboekin erabiltzen da. Abzisen ardatzean (horizontalean) modalitateak jartzendira (hobeto esanda, modalitatearen mailak edota hauek izendatzeko erabilitako zenbakiak jartzen dira).Modalitate bakoitzaren gainean, dagokion maiztasunarekin baliokidea den altuerako laukizuzen bataltxatzen da. Kasu hauetan laukizuzenaren oinarriak guk nahi dugun zabalera izango du, bainalaukizuzen guztiek zabalera bera izango dute.

Ikus dezagun SPSSWIN erabiliz AITAIKAS: aitaren ikasketak aldagaitik lortu dugun barra-diagrama.

Kasu honetan maiztasunak absolutuak dira. Irakurlea, portzentaiak azaltzen diren antzeko bat lortzensaia daiteke. Hemen aurkezten den grafikoa lortzeko eman diren pausoak, LIBURU.SAV, datu-fitxategiakargatu ondoren, hauek izan dira.

GráficosBarras (simples-en irudia zapaldu)

Definir...

Eta leiho hau lortzen da:

28

Page 41: Estatistika teoria eta praktika SPSSWIN erabiliz

non Nº de casos aukera hartu, aldagaiaren izena (AITAIKAS) Eje de categorías agertzen den tokian jarrieta Aceptar sakatzen den.

Grafiko hau lortzen da:

2.2.2. Sektoreak

Aldagai kategorikoetarako bakarrik erabiltzen da.

Denok ezagutzen dugu mota hau. Zirkulu baten azalera, kategoria bakoitzaren maiztasunen pro-portzio berean banatzen da.

Segidan, SPSSWINekin lortu den AMAIKAS aldagaiaren sektore-diagrama ikus daiteke. Honakoaukera eginez eskura dezakezu:

GráficosSectores...

eta: Resúmenes para grupos de casos botoia sakatu, eta Definir aukerak egin ondoren leiho hau lortzenda; bertan, AMAIKAS aldagaiaz baliatuz, Definir sectores por: eskatu da. Aceptar sakatzen da ondoren.

29Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

AITAREN IKASKETA-MAILA

IKASKETARIKGABEAK

LEHENHEZKUNTZAKOAK

BIGARRENHEZKUNTZAKOAK

ERDIMAILAKOAK

GOI MAILAKOAK:UNIBE

Cou

nt

140

120

100

80

60

40

20

0

BARRA-DIAGRAMA

Page 42: Estatistika teoria eta praktika SPSSWIN erabiliz

Lortutako Sektore-diagrama hau da:

Oharra: Beharbada, irudian datu galduen (Omitido - Datos perdidos) kategoria agertuko da (edo ez). Halabada, eta aldatu nahi bada, sakatu Opciones botoia, eta... asmatu.

2.2.3. Piktograma

AZALERA edo GAINAZALA kategoria bakoitzaren maiztasunarekin proportzionala den marrazkietanoinarritua dago.

Ondoren daukagu adibide bat.

Grafiko-mota hau azpimarragarria da, sarritan modu desegokian erabiltzen baita irakurlearengansentsazio faltsuak sortuz.

Irudi ezberdinen arteko proportzioak, azalerarenak izango dira, eta ez altuera edo zabalerarenak.

Hau da, bigarren kategoriako maiztasun bikoitza duen kategoria batentzat, altuera bikoitzeko marrazkibat erabiltzen badugu, azalera, lau aldiz handiagoa izango da, eta guk agertzen ditugun irudien artekoproportziak faltsuak izango dira. Ikus dezagun adibide bat:

Hau piktogramaren adibide tipikoa izan daiteke. Bertan, pertsona bakoitzak duen diruaren propor-tzioko marrazki bat aurkezten da. Ikus itzazu proportzioak marrazkietan; azaleraren proportzioen araberaosatzen dira eta ez, berauen luzera edo zabaleraren proportzioen arabera. Marrazki bakoitzaren luzera,aurrekoarenaren bikoitza da. Zabalera ere bikoitza da. Horregatik azaleraren arteko proportzioa 4tik1ekoa da, benetan ageri nahi zen proportzioa, alegia.

30

IKASKETARIKGABEA

LEHENHEZKUNTZAKOAK

BIGARRENHEZKUNTZAKOAK

ERDIMAILAKOAK

GOI MAILAKOAK:UNIBE

Amaren ikasketa-maila

PIKTOGRAMA: Diru-kopurua

AMAIA:16 milioi

MAIDER:4 milioi

IRENE:milioi bat

Page 43: Estatistika teoria eta praktika SPSSWIN erabiliz

2.2.4. Histograma

Irudikatu nahi den aldagaia tartekako eskala batean neurtzen denean erabiltzen da. Hau da, aldagaiakzenbakizkoak direnean. Bere eraketa barra-diagramaren antzekoa da.

Aurrera jarraitu baino lehenago... hiru zehaztasun; bat: laukizuzenaren azalerak tartearen mugaerrealekin bat etorri behar du (gogora ezazu muga erreal eta itxurazkoaren arteko ezberdintasuna). Bi:maiztasuna laukizuzenaren AZALERAk irudikatzen du. Eta hiru: oro har, histograman, tartearen markaedota tarte bakoitzaren mugak adieraziko dira.

Tarte guztiek zabalera bera dutenean gertatu ohi da azalerak luzerarekiko proportzionalak izatea eta,era berean, biak tarte bakoitzaren maiztasunarekiko proportzionalak izango dira. Baina tarteek zabaleraberdina ez dutenean, luzerak EZ DIRA maiztasunekiko proportzionalak izango.

Ikus dezagun ondoren SPSSWINekin lortu dugun BIOLOGIA aldagaiaren Histograma. Hau lortzeko,eman ditugun pausoak:

GráficosHistograma...

Eta beheko leihoan ikus daitekeen bezala, Variables atalean Biologia kokatzen da. Kurba normalagainjar dezan Mostrar curva normal aktibatzen da eta ondoren Aceptar.

Lortu den emaitza ondorengoa da:

31Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

BIOLOGIA

25,022,520,017,515,012,510,07,5

120

100

80

60

40

20

0

Des. tip. = 3,60Batezb. = 17,5N = 332,00

Page 44: Estatistika teoria eta praktika SPSSWIN erabiliz

2.2.5. Maiztasun-poligonoa

Maiztasun-poligonoa edo poligonala, histogramari dagokion laukizuzenaren punturik altuenean tartebakoitzaren erdiko puntuak elkartuz lortzen da.

Maiztasunen poligonoaren erabilpenik oinarrizkoena talde ezberdinetan kategoria zehatzenportzentaiak konparatzeko izan ohi da. Aztertuko den adibidea oso arrunta da: EUSKAMA, Amareneuskara-maila aldagaiaren kategoria bakoitzaren portzentaien konparaketa egitea, bere seme-alabak A etaD eredura eramaten dituzten amen artean.

Ondoren azaltzen dugun grafikoa lortzeko, LIBURU.SAV datu-fitxategia kargatu ondoren emanbeharreko pausoak hauek dira:

GráficosLíneas...

Eta leiho hau lortuko da, bertan, Múltiples eta (Definir) aukera hautatuz.

Aurreko grafikoetan bezalaxe, kategorien ardatzean aldagaiaren izena barnean hartzen da EUSKAMA(kategorikoa), azpian, Definir líneas por... agertzen den tokian, EREDUA, eta goian % de casos botoiaeragiten da. Aceptar. Leihoa modu honetan geratzen da:

32

Page 45: Estatistika teoria eta praktika SPSSWIN erabiliz

Lortzen dugun grafikoa hau da:

Hiru poligonal ditugu: A eredukoei, B eredukoei eta D eredukoei dagozkienak. Ordenatuen ardatzean(bertikala) % de casos aukeratu denez, portzentaiak agertzen dira. Ziur aski, hiru poligonalakkonparatzeko modurik errazena da. Grafikoaren interpretazioa nahikoa begibistakoa dirudi, eta zeureesku uzten dut... Emaitzak nahikoa logikoak dira, ezta?

2.2.6. Kaxa-diagrama

Azkenik, kaxa-diagrama aurkezten dizut. Grafiko-mota hauetan, pertzentil desberdinen balioak aurkeztendira.

Aurrerago azaltzen dizut adibide bat, EUSKTOT aldagaiari dagokiona. Hau lortu ahal izateko jarraitubeharreko pausoak hauek dira:

GráficosDiagrama de cajas...

simples, Definir

Eta agertzen den leihoa, hemen azaltzen den bezala, osatua gelditzen da: “Variables”-en EUSKTOT eta“eje de categorias”-en SEXUA.

33Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

AMAREN EUSKARA-MAILA

ONGINAHIKOA, ZAILTASUNEZEZER EZ

Percent

70

60

50

40

30

20

10

0

EREDUA

A EREDUA

B EREDUA

D EREDUA

Page 46: Estatistika teoria eta praktika SPSSWIN erabiliz

Lortzen den grafikoa hau da:

Sexu bakoitzarentzat 5 balio topatzen ditugu: handiena, 75, 50 eta 25 pertzentilak eta balioriktxikiena. Lerro horizontal bakoitzari balio bakoitza dagokio. Une honetan, interes handikoak iruditzenzaizkidan grafiko-mota hauen izaera baino ez dut azaldu nahi izan eta bere interpretazio zehatzerako,irakurleak banakako posizioen neurriei zuzendutako atalera jo beharko du, bertan gai hau zehaztasunhandiagoz berrartuko delarik.

OHARRA: Behar bada, Sektore-diagramaren kasuan bezala, hemen ere, irudian datu galduen kate-goria agertuko da. Kentzeko, sakatu Opciones botoia, ete hemen ere... asmatu.

2.2.7. Irudipen grafikoetarako arauak

Garai batetik hona bada merkatuan informatikako tresna bikainik, erabilpen erraza eta itxura ederrekografikoak lortzen laguntzen digutenak. Baina, agian, erabilera errazak eta grafikoak erabiltzeko oinarrizkoarauak ez ezagutzeak, zenbaitetan zentzugabeko estatistika egitera garamatza. Hori bai, oso polita etaestetikoa. Ikus ditzagun gauzak ondo egiten lagunduko diguten arau erraz batzuk:

1.- Grafikoen helburua aldagai baten ezaugarriei buruzko informazioa erraz ikusteko moduan ematea da.Itxura garrantzitsua da, baina ez du inoiz informazioa gorde edo faltsutu behar.

2.- Irudikapen grafikoa egitean, aldagaia neurtzeko erabili den eskala-mota gogoan izan beharko da.

Erabilitako eskala NOMINALA denean, hau da aldagaia koalitatiboa denean, honakoak erabildaitezke: Barra Diagrama, Sektoreena eta Piktograma.

Eskala ORDINALA edo TARTEKAKOA denean, hau da aldagaia koantitatiboa denean, irudikapengrafikorik egokiena Histograma izango da.

3.- Abzisen ardatzak (horizontala), gehienetan, aldagaien puntuaketak edo honen kategoriak adieraztenditu, ordenatuen ardatzak (bertikala) maiztasunak edota portzentaiak adierazten dituen bitartean,metatu nahiz metatugabeko kasuetan.

4.- Abzisen ardatzean puntuazio txikienak ezkerraldean kokatuko dira eta handienak eskuinean.Ordenatuen ardatzean, maiztasunek, normalki 0n hasi behar dute, maiztasun txikienak behean etahandiak gorago geratuz.

5.- Ardatz bakoitzeko unitate neurriak aukeratzeko unean, informazio onargarria ematea itxura politaizatea baino garrantzitsuagoa da.

34

169122N =

SEXUAEMAKUMEAGIZONA

EU

SK

TO

T

100

90

80

70

60

50

40

30

20

EUSKTOT

Page 47: Estatistika teoria eta praktika SPSSWIN erabiliz

6.- Maiztasun txikiena oso altua denean edo aldagaiaren balio txikiena 0tik oso urrun dagoenean(portzentualki), dagozkien koordenatuen ardatzetan bi ebaki egin daitezke, horrela garbi adieraziageratuko baita distantziak ez direla proportzionalak.

7.- Modu esplizitu batean, ardatzetako bakoitzak adierazten duena azaltzea beharrezkoa da.

8.- Grafikoaren izenburuak adierazi nahi denaren definizioa izan behar du.

2.2.8. Grafiko engainagarriak

Ikus ditzagun ondoren, erabilpen eztabaidagarria izan dezaketen grafiko batzuk.

Lehenengo adibidea, Campbell, S.K.(1974); Equívocos y falacias en la interpretación de estadísticaspp.66-77 -tik hartutakoa da. Hemen, datu-multzo beraren irudikapen ezberdinak ikus daitezke.

Datuak berak dira, baina irudikapena erabat diferentea da. Eta, itxuraz, irudi guztiak ongi daude.Begira zeintzuk diren egindako aldaketak. B grafikoan azken urtea ezabatu egin da, honekin azken urteangora egin duen joeraren sentsazioa desagertzen delarik eta, ondorioz, ikuspuntu ona ez baino aurkakoaeskaintzen digu. Azken joera beherakoa da.

35Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

A B

C

D

Page 48: Estatistika teoria eta praktika SPSSWIN erabiliz

D grafikoan, ardatz bertikalaren, ordenatuaren, eskala aldatu egin dugu. Datuek guztiz aldakorrakdirudite, gorabehera asko dituzte, ezegonkortasun eta zalantza-sentsazioa ematen dute. Irudi honikontrajarrita E dugu, (berriz ardatz bertikalaren eskala aldatu dugu). Hemen baretasun itxura hartzen du,ezer aldatzen ez denaren itxura ematen digu. Egonkortasuna ia erabatekoa da.

Irudi-aldaketa hau emateko, ardatz bertikaleko edo ordenatuetako eskala aldatu baino ez da egin.

D grafikoan zera esan behar da: 0 baliotik 80 baliorako eskala bera ez dela segitzen, 80tik aurrerakoabaizik.

Bigarren kasu bat

Hau “Telefónica Española”ko iragarki batetik hartua dago. “Mozkin Garbi Bateratua” delakoa, 1992tik1996ra doazen urteetan, 80.7tik 160.2ra igo dela (ia bikoiztu) egia bada ere, hori adierazteko baliatzendiren antena parabolikoen erabilpenen piktogramak ez du proportzio bera mantentzen. Etekinak 16 aldizhandiagoak dira eta hau faltsua da. Gogora dezagun, piktogramekin proportzioa azaleraren araberakoadela.

Bestalde, “Pta/akzio dibidendua” delakoa, ia % 50 igo da (61etik 89ra, hain zuzen), hau da, azkena,hasierakoen 1 eta erdia da. Ostera, dagokion piktograman, antenen azaleren arteko proportzioa 9koa da.9 aldiz hasierakoa dela sinestarazi nahi digute... Eta hori gezurra da.

36

Page 49: Estatistika teoria eta praktika SPSSWIN erabiliz

Egunkari madrildar batetik hartutako TVEko iragarki honetan, “amarru” txiki batez baliaturik TVEk bereaurkakoekiko abantaila hartzen duela ikus daiteke. Hau “frogatzeko” bi kateetako portzentaiak batzenditu noski, bere abantaila modu lotsagabean gehitzeko. “2. kateak” egia esan, autonomikoen atzetik egonbehar luke... Beste trukotxo bat.

Azken bi adibide.

Campbell S.J. (1974), 66-67 orrialdeetatik hartu ditudan bi adibide hauetan bi “tranpa” berri ikus daitezke.

Lehenengo kasuan, grafikoaren eskala aldatzen duten bi irudi inozo sartzen dira ardatz bertikalean eta,ondorioz, zuzenaren malda modu lotsagabean handitzen da.

Bigarrengoan, horizontaletik asko urruntzen den sentsazioa areagotzeko, azken finean berdinak direnbi kurba marrazten dira. Bata kontsumorako prezioen indizea da eta, bestea, eros-ahalmenekoa. Azkenhau, hain zuzen, aurrekoaren aurkakoa da. Bietako bat aski litzateke.

37Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Akzioak

Urteak

kontsumorako prezioenindizea

monetareneros-ahalmena

Urteak

Page 50: Estatistika teoria eta praktika SPSSWIN erabiliz

Aurreko adibideak aski direla uste dut, aurkezten diren grafikoak ikusteko eta hauek interpretatu,begiratu eta irakurtzeko garaian burutsuagoak edo kritikoagoak izateko. Hala bedi!

Esandakoak esanda, beste grafiko-mota bat aurkeztera natorkizu. Duen garrantzia eta eskaintzen dueninformazioa dela eta, oso tratamendu berezia merezi du. Adar eta orrietako diagramak dira; ingelesez:STEM & LEAF izenekoa.

2.2.9. Adar eta orrien diagrama

Grafiko-mota hau irudikapen grafiko eta maiztasunen sailkapenen erdian dago eta aldagai bati buruzkoinformazioa emateko garaian oso egokia suerta daiteke. Ondorioz, nahiz eta oraindik oso ezaguna ezizan, atal berezi bat ondo merezia duela uste dut.

Hemen duzu adibide bat.

Berau lortzeko eman diren pausoak:

EstadísticosResumir

Explorar...

Eta leiho hau lortuko da:

Agindupeko zerrendan (Dependientes) Eusktot jarri dut, eta faktoreen zerrendan (Factores): SEXUA.(Aceptar).

Emaitzak bi zatitan banatzen dira. Guk hemen emaitza grafikoa baino ez dugu aztertuko. Bestea,lehen zatian agertzen dena, aurrerago, gai honetan bertan ikusiko diren balio batzuek ematen dituzte, etageroago aztertuko da.

Emaitza grafikoa bi zatitan banatuta agertuko da: gizonak eta emakumeak. Biak baliokideak direnez,gizonena ikusiko dugu. 6.1.3. bertsiokoa hau da.

38

Page 51: Estatistika teoria eta praktika SPSSWIN erabiliz

EUSKTOT

By SEXUA 1 GIZONA

Valid cases: 121,0 Missing cases: 4,0 Percent missing: 3,2

Frequency Stem & Leaf

2,00 2 . 79

1,00 3 * 2

2,00 3 . 88

6,00 4 * 111222

7,00 4 . 5667889

8,00 5 * 00111134

13,00 5 . 5555667777899

14,00 6 * 01111222233334

14,00 6 . 66666777788899

14,00 7 * 00000112334444

17,00 7 . 56666667777788999

15,00 8 * 000000111223333

8,00 8 . 55577777

Stem width: 10,00

Each leaf: 1 case(s)

Grafikoa, aldagaiaren izenarekin hasi ondoren, ezkerraldeko zutabean, Frequency izenburuarenazpian, aldagaia aurkezten duen tarte bakoitzaren maiztasunak agertzen dira.

Errealitatearen histograma izanik, gure datuak “ikusteko” tresna interesgarria bihurtzen duenberezitasun bat du. Adarra eta Orriak izenez ezagutuko ditugunak, azken batean, tarteak eta balioakizango dira.

Ikus ditzagun tarteak (adarrak) nolakoak diren. Horretarako, STEM (ADARRA) zutabea azter dezagun.Hamarrekoak agertzen direla ikusten dugu. Horrela, 3 balioa bi aldiz azaltzen da; behin asteriskoajarraian duela (*) eta bestean puntu bat duela (.). Lehenengo hamarrekoari dagozkion bi tarteak dira.Modu berean, zutabe horretan 4 bi bider azaltzen da, behin asteriskoa atzetik duela eta bestean puntuasegidan duela; 4 (adarra) hamarrekoen adierazlea da eta (*) eta (.) batekoenak (orriak).

Nola jakin hamarrekoak direla? Bada, beherago Stem width izeneko zutabean, zutabeko baliobakoitza zein baliorekin biderkatu behar den azaltzen baitu: Stem10.

Berrogeitaka horien (4*-ren) hamarrekoen lehen zatiko maiztasuna zein da?: 6. Eta 6 balio horiek,zehazki, zein dira?: 4* -ko zutabean honako zifrak azaltzen dira: 111222 (guztira 6). Hauek tarte honetakozenbakien bukaerak dira, beraz (40-44) tartearen balioak: 41,41,41,42,42,42 dira. Bigarren azaltzen denzati honi orriak deritzo (LEAF). Hemendik dator adarra eta orriak izena.

Behealdean, zifra bakoitzak datu bakar bat irudikatzen duela azaltzen da. (Each leaf: 1 case(s)). Ariketabezala, 55 eta 59ren arteko 13 balioak honakoak direla “ikusten” saia zaitezke:

55,55,55,55,56,56,57,57,57,57,58,59,59.

Hala ere zenbaitetan, aurrerago azalduko den diagraman bezala, zifra bakoitzak bi kasu irudikaditzake. Kasu hauetan, batzuetan, maiztasunen sailkapenen ertzean batez ere, & ikurra erabiliko du kasubakar bat adierazteko.

39Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 52: Estatistika teoria eta praktika SPSSWIN erabiliz

Ondorengo irudia lortzeko, lehen bezala, jarraitutako pausoak hauek izan dira:

EstadisticaResumir

Explorar...

Eta “menpeko zerrenda” deiturikoan Matemati jarri behar izan da. Kasu honetan pertsona guztienemaitzak bloke batean aurkeztu nahi direnez, ez da aldagairik jarri “Faktoreen zerrenda” izenekoan.Aceptar.

Lortu diren emaitzak, SPSSWINeko bi bertsioetan bat datozenak, hauek dira:

MATEMATI

Valid cases: 329,0 Missing cases: 6,0 Percent missing: 1,8

Frequency Stem & Leaf

2,00 Extremes (4), (10)

1,00 1 * &

2,00 1 t 3

11,00 1 f 44555

14,00 1 s 666677

30,00 1 . 888888888999999

42,00 2 * 00000001111111111111

44,00 2 t 222222222233333333333

52,00 2 f 44444444444444455555555555

48,00 2 s 66666666666677777777777

45,00 2 . 8888888888888899999999

22,00 3 * 0000011111

15,00 3 t 2222233

1,00 3 f &

Stem width: 10

Each leaf: 2 case(s)

& denotes fractional leaves.

Hemen hamarreko bakoitzarentzat, beltzez azpimarratu ditudan bost ikur agertzen zaizkigu: * t f s .Kasu honetan, hamarrekoa 5 zatitan deskonposatzen da, zati horietako bakoitza 2 baloreri egokituz.Adibidez:

2* 0 eta 1 (diagraman 20 edo 21eko 42 kasu daude)2t 2 eta 3 (diagraman 22 edo 23ko 44 kasu daude)2f 4 eta 5 (diagraman 24 edo 25eko 52 kasu daude)2s 6 eta 7 (diagraman 26 edo 27ko 48 kasu daude)2. 8 eta 9 (diagraman 28 edo 29ko 45 kasu daude)

Gogoan hartzeko beste xehetasun bat; zenbaitetan, goiko ilaran edota behekoan, “Extremes”izenarekin, azken balioa azaltzen da.

Gure adibidean, 2.00 Extremes (4) (10) agertzen da. Honek, erdiko ilaretan aurkeztutako balioez gain,tarteetatik kanpo geratzen diren, eta nolabait segidaren uniformetasuna errespetatzen ez duten, 4 eta 10balioko, bi elementu daudela adierazten digu. Balio hauei “outlier” ere deitzen zaie. Bere existentziazohartarazten gaitu, zeren eta, sarritan, aldagaia deskribatzeko kalkula ditzakegun balio estatistikoak moduesanguratsuan alda baititzake.

40

Page 53: Estatistika teoria eta praktika SPSSWIN erabiliz

Normalean, besterik ez bada agintzen, muturreko edo “outlier” bezala hartuko ditu batezbestekotik bidesbideratze tipiko baino gehiagoko distantziara daudenak. (Batezbesteko eta desbideratze tipikoarenkontzeptuak hurrengo atalean aztertuko ditugu).

2.3. MAIZTASUN-BANAKETAREN PROPIETATEAK

Datuak maiztasun-banaketaren bidez aurkezteko modua ikusteaz gain, hauek modu grafikoan azaltzekoera desberdinak ikusi ditugu. Hemendik aurrera, gure datu-multzoen zenbakizko ezaugarri batzukaztertuko ditugu, datu-multzoen errealitatea “ikusten” lagunduko digutenak. Eta aztertu nahi dugunezaugarri edo propietatearen arabera modu ezberdinez izendatuko ditugu.

5 neurri-mota ezberdin aztertuko ditugu:

1.- Joera Zentraleko Neurriak (Indizeak). Banaketaren “puntu zentralak” zeintzuk dira? Galdera honierantzuna ematen saiatuko garen indizeak dira. “Puntu zentralak” terminoari egiten dizkiogunñabarduren arabera, indize-mota ezberdinak lortuko ditugu: Batezbestekoa, Mediana eta Modaezinbestekoak dira. Neurri hauei sarritan ezartzen zaien funtzioetako bat, aztertzen ari garen taldeaORDEZKATZEA da. Aztertzen ari garen aldagaiaren ordezkari izan nahi luketen balioak dira.

2.- Banakako Posizioko Neurriak (Indizeak). Askotan, banakako balioak, erreferentzi talde batekoekinkonparatzen ez badira behintzat, ez dira baliagarriak izango. Horrela, haur batek 6 kilo pisatzen duelaesateak ez dit bere gizentasunarekiko informazio handiegirik eskaintzen, bere adinaren edo, behintzat,adin horretako haurren ohizko pisuaren berririk ez badut. Behar honi erantzuteko sortzen dirapertzentilak,... eta beste posizio-neurri batzuk.

3.- Sakabanatze edo Aldakortasun Neurriak (Indizeak). Datuen sakabanatzea ezagutzen ez bada, zentra-lizazio-neurriek, batzuetan, ez dute ezertarako balio. Talde baten soldataren batezbestekoa 200.000pezetakoa dela esaten bada, honek gutxi balio lezake askok gutxi eta gutxik asko irabazten badute...;beste gauza bat litzateke denek berdin irabaziko balute. Nola jakin denek berdintsu edo askok gutxieta gutxik asko irabazten duten? Sakabanatze-neurriak erabiliz.

Beste adibide bat. Bi pertsonen artean oilasko bat jaten badute, ez da berdin bakoitzak oilasko erdiajatea (ez dago balioen arteko ezberdintasunik) edo batek osoa jan eta bestea gosez geratzea (balioenarteko izugarrizko ezberdintasuna). Estatistikaren ikuspuntutik ere ezberdina da. Gure datuakuniformeak zenbateraino diren edo beraien artean oso hurbil dauden edo oso berezituak dauden ikusinahi badugu, sakabanatze-neurriak erabiliko ditugu.

4.- Asimetriazko Neurriak (Indizeak). Batezbestekoarena inguruan nola sailkatzen dira datuak? Behetikbaino goitik elementu gehiago al dago? Gure datuen grafikoak ba al du antzekotasunik batezbeste-koarekiko simetrikoa den kurba normaleko grafikoarekin? Galdera hauei erantzuteko, Asimetri indi-zeak erabiliko ditugu.

5.- Zorroztasun edo Kurtosi Neurriak (Indizeak). Zenbateraino biltzen dira datuak batezbestekoareninguruan? Datu asko biltzen badira, gure datuen grafikoa oso zorrotza edo apuntatua izango da, osogutxi biltzen badira, oso laua izango da. Gure datu-bilketaren maila neurtzeko, edo berdina dena, guregrafikoaren Zorroztasun-maila neurtzeko, Kurtosi indizea kalkulatuko dugu.

2.3.1. Joera zentraleko neurriak (indizeak)

Zein da ikasturte jakin bateko ikasleen adinaren batezbestekoa? Zein da iaz Errealak gehien lortu zuenemaitza? Zein da gelako ikasleen pisuaren batezbestekoa? Galdera hauei erantzuteko Zentraliza-zio-neurriak erabiliko dira.

Demagun 11 pertsonen pisuak ditugula:

60, 60, 60, 63, 64, 68, 70, 71, 99, 102, 110

41Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 54: Estatistika teoria eta praktika SPSSWIN erabiliz

Zein da, hauek guztiak, ongien “ordezkatzen” dituen pisua? Zein da pisu zentrala?

Lehen soluzio bat, batezbestekoa kalkulatzea litzateke.

Kalkuluak eginak ditugu: 75.2 kilo. Ez dirudi pisu honen antzekorik inork duenik. 75.2kobatezbestekoak baino gehien errepikatzen den pisuak (60 kilok), orokortasuna hobeto ordezkatzen duelaesan dezake norbaitek. Beste hirugarren batek, hobekien ordezkatzen dituen pisua 68 kilo dela esaten du,pisu guztiak ordenatu ondoren, erdian geratzen dena hori delako. 68 kilo baino gehiago eta gutxiagopisatzen duten pertsona-kopurua berdina da.

Aukeratutako hiru pisuen atzean, joera zentraleko indizeetara eramango gaituzten hiru kontzeptuakgordetzen dira: BATEZBESTEKOA, MODA eta MEDIANA.

2.3.1.1. Batezbesteko aritmetikoa

Joera zentraleko indizerik erabiliena da. Bere definizioa: behatutako balioak batuz eta batura zatizenbaki-kopurua (n) eginaz lortzen den zenbakia da. Adierazteko garaian, aldagaiarentzako erabiltzenden letra marratxo horizontal bat gainean duela erabiliko da.

Formula hau da:

Zenbait balioren batura kalkulatu behar denez, hauek zenbakizkoak izan behar dute eta, horregatikaldagaiak koantitatiboa izan behar du. Aldagaia neurtzeko erabili den eskalak, gutxienez, ordinala izanbehar du.

Behatutako balioen batura kalkulatzean, aurreko formula jarraituz, banan-banan edo epeka egingo daepe bakoitzean kategoria bakoitzeko balioak batuz. Honela, beheko banaketaren kasuan, X=2 balioguztien batura kalkulatuko dugu, gero berdin X=3rentzako, berdin X=4... Honekin zutabe berri batlortuko dugu Xi * ni izenekoa, eta hau batuz batezbestekoa eskuratuko dugu.

Xi ni ni*Xi

2 2 4

3 7 21

4 14 56

5 21 105

6 16 96

7 12 84

8 9 72

9 8 72

10 1 10

n=90 520

Erabiliko dugun formula:

Gure kasuan emaitza hau da:

X =ni* X

ni=

520

90= 5.77i∑

X =ni* X

n

i

i

X = Xn

i∑

42

Page 55: Estatistika teoria eta praktika SPSSWIN erabiliz

Aldagai jarraien maiztasun-banaketaren kasuan, aurretiko pauso bat eman behar da: klase-markakdefinitzea. Gogora dezagun klase-markak, klase edo tarte hauen ordezkari direla eta balio hauek izangodira tarte bakoitzeko elementuen balioen batura kalkulatzeko erabiliko direnak.

Horrela, gai honen hasieran aztertu dugun kasuan:

Tarteen Tarteen Tarte-

benetako itxurazko ni -marka edo ni * Xi

mugak mugak ordezkaria

1.5 – 7.5 2 – 7 1 4.5 4.5

7.5 – 13.5 8 – 13 4 10.5 42

13.5 – 19.5 14 – 19 5 16.5 82.5

19.5 – 25.5 20 – 25 10 22.5 225

25.5 – 31.5 26 – 31 12 28.5 342

31.5 – 37.5 32 – 37 10 34.5 345

37.5 – 43.5 38 – 43 8 40.5 324

43.5 – 49.5 44 – 49 9 46.5 418.5

59 1783.5

Beraz, batezbestekoaren emaitza hauxe da:

2.3.1.1.1. Batezbestekoaren ezaugarriak

1.- Puntuazio-talde bati konstante bat batzen badiogu, puntuazio berrien batezbestekoa ere, konstantehorretan handituko da.

Yi = Xi + K bada, Yren batezbestekoa : Y = Xen batezbestekoa + K

Adibidez: Xen puntuazio bakoitzari, 10 gehitzen badiot, batezbesteko berria ere, aurrekoa baino 10unitate handiagoa izango da.

Oinarrizko Puntuazioak: 5,7,9,6,8,6,8 batezbestekoa = 7

Puntuazio berriak: 15,17,19,16,18,16,18 batezbesteko berria = 17

2.- Puntuazio-talde bat konstante bategatik biderkatzen badugu, batezbestekoa ere konstante horregatikbiderkatua geratuko da.

Yi = K * Xi bada, orduan Yren batezbestekoa: -Y = K * -X

Adibidez: Xen puntuazioetako bakoitza, bider 10 egiten bada, batezbesteko berria ere, aurrekoa baino10 bider handiagoa izango da.

Oinarrizko Puntuazioak: 5,7,9,6,8,6,8 batezbestekoa = 7

Puntuazio berriak: 50,70,90,60,80,60,80 batezbesteko berria = 70

3.- Hasierako puntuazioei batezbestekoa kenduz lortzen ditugun puntuazioei diferentziazko puntuazioakderitze. Diferentziazko puntuazioen batura eta batezbestekoa, beti 0 da.

Hasierako puntuazioak: 5, 7, 9, 6, 8, 6, 8 batezbestekoa = 7Diferentziazko puntuazioak: -2, 0, +2, -1, 1, -1, 1 Batura = 0

X =ni * X

n=

1783.5

59= 30.228i

i

43Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 56: Estatistika teoria eta praktika SPSSWIN erabiliz

4.- Beste aldagai batzuen konbinazio lineala bezala definitutako aldagai batek batezbesteko bezala,aldagaien batezbestekoen konbinazio lineal bera du.

Yi = a * Xi + b * Zi bada, orduan

Yren batezbestekoa: Y = a * Xen batezbestekoa + b * Zren batezbestekoa.

X: 5,7,9,6,8,6,8 Batezbestekoa = 7Z: 1,4,3,2,1,4,6 Batezbestekoa = 3

Definitzen dugu Y = 6X - 4Z

Yren puntuazioak = 26, 26, 42, 28, 44, 20, 24 Yren batezbestekoa = 30

Yren batezbestekoa = 6 * Xen batezbestekoa – 4 * Zren batezbestekoa = 6 * 7 – 4 * 3 = 30

5.- Na elementu dituen A talde baten batezbestekoa, Xa bada, eta Nb elementu dituen B taldekoarena,Xb bada, bi taldeetako elementuez osatutako kolektiboaren batezbestekoa honako hau izango da:

Horrela, 60 emakumeren batezbestekoa 25 urtekoa baldina bada, eta 40 gizonen batezbestekoa 30,kolektibo osoko adinaren batezbestekoa, hau da 100 pertsonena hau izango da:

Aurreko formula, kolektibo bat osatzen duten k azpitaldera berehala orokortzen da, modu honetan:

2.3.1.2. Mediana

Puntuazioak txikienetik handienera ordenatzen baditugu, medianaren balioa erdiko posizioan dagoenpuntuazioarena da. Puntuazio-kopurua bikoitia bada, mediana erdiko bien bitarteko balioa izango da.

Puntuazio ordenatuez hitz egiten ari gara, beraz, aldagaiak ere, eskala ordinal batean neurtua egonbeharko du gutxienez.

Aurreko maiztasunen sailkapenetarako mediana (na) kalkula dezagun.

Xi ni na

2 2 2

3 7 9

4 14 23

5 21 44

6 16 60

7 12 72

8 9 81

9 8 89

10 1 90

N=90

X = N * X + N * X +...+ N * X

N + N +...+ N

1 1 2 2 k k

1 2 k

X =60* 25 +40 *30

60 + 40=

1500 +1200

100= 27

X = N * X + N * X

N + N

a a b b

a b

44

Page 57: Estatistika teoria eta praktika SPSSWIN erabiliz

Lehenengo kasuan (aurrenengo taula), 90 elementuak txikienetik handienera antolatu ditugu balioenarabera. Mediana kalkulatzeko, behin ordenatu ondoren, erdiko bi balioak ezagutzea aski da (45. eta 46.ordena betetzen dutenak). (Hau hala da, elementu-kopurua bikoitia delako, bakoitia balitz erdikoelementua ezagutzea aski litzateke). Gure sailkapenean 45. lekua betetzen duen elementua 6 dela ikustendugu eta 46. lekua betetzen duena ere 6 da. Beraz, mediana 6 da.

Baina, nola dakigu 45.ean dagoen balioa 6 dela?

Ikus dezagun. Bi balorerik txikienak 2 eta 2 dira. Ondorengo 7ak 3,3,3,3,3,3,3 dira. Ondorengo 14ak:4,4,4,4,4,4,4,4,4,4,4,4,4,4; eta horrela elkarren segidan. Irakurleak 45. eta 46. ordenetako balioak bi 6kodirela froga dezake.

Bigarren kasuan, tartetako eskala batean neurtutako aldagai baten maiztasunen banaketarekin topoegiten dugu.

Tarteen Tarteen ni na

benetako mugak itxurazko mugak

1.5 – 7.5 2 - 7 1 1

7.5 – 13.5 8 – 13 4 5

13.5 – 19.5 14 – 19 5 10

19.5 – 25.5 20 – 25 10 20

25.5 – 31.5 26 – 31 12 32

31.5 – 37.5 32 – 37 10 42

37.5 – 43.5 38 – 43 8 50

43.5 – 49.5 44 – 49 9 59

59

Aldagaia tartekako eskalan neurtua dagoen kasuetan, medianaren balioa kalkulatzeko garaian,ondorengo formulaz baliatuko gara:

Non Md: medianaren balioa den.Li: mediana aurkitzen deneko tartearen beheko muga den.Ii: mediana aurkitzen den tartearen zabaltasuna den.ni: mediana aurkitzen den tartearen maiztasuna den.N: maiztasun osoa edo elementu-kopurua den.Ni-1: mediana aurkitzen den aurreko tarterainoko maiztasun metatua adierazten duen.

Etengabe i tarteaz ari gara. Hau mediana kokatua dagoen tartea da. Baina non, zein tartetan kokatzenda mediana? Horretarako, bi pauso hauek ematea litzateke onena:

1.- Puntazioak txikitik handira ordenatzea,

2.- Maiztasun metatuen zutabea kalkulatzea,

Maiztasun osoaren erdia, maiztasun metatuaren balioa, baino txikitik handiago izatera, zein tartetanpasatzen den ikustea da. Gure kasuan 29 baino gehiago, edo berdina dena, 30. ordeneko balioa kokatzenden tartea: 25.5 - 31.5

Md = L +

N

2N

n* Ii

i -1

ii

45Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 58: Estatistika teoria eta praktika SPSSWIN erabiliz

Beraz gure adibidean:

Li = 25.5, Ii = 6, ni = 12, N = 59, Ni-1 = 20

Eta medianaren balioa honakoa izango da:

2.3.1.3. Moda

Joera zentrala duen neurri honek, neurrien taldean gehien errepikatzen den puntuazioa, kategoria edomodalitatea zein den azaltzen du. Modaren abantailarik handiena edozein datu-motekin kalkuladaitekeela da. Bestalde, bere desabantaila, lagin batetik bestera asko alda daitekeela da.

Puntuazio-talde batean gehien errepikatzen diren balioak bi direnean, sailkapena bimodala da. Etagehien errepikatzen diren balioak asko direnean berriz multimodala da.

2.3.1.4. Joera zentraleko zein neurri erabili behar da?

Neurririk erabiliena, eta kasu gehienetan komenigarriena, BATEZBESTEKOA dela garbi utzi ondoren,honako puntu hauek aintzakotzat har daitezke:

1.- Batezbestekoan, laginaren edozein puntuazio-aldaketak eragin handia izaten du. Honela, puntuaziohauetan:

4, 4, 6, 7, 7, 7, 9, 9, 10 Batezbestekoa = 7 Mediana = 7 Moda = 7

Edozein puntuazio aldatzen bada, batezbestekoa ere aldatzen da: 10a 11 balio izatera pasatzen bada,batezbestekoa aldatu egiten da. Ez da berdin gertatzen mediana eta modarekin.

2.- Talde txikitan moda oso aldakorra gerta daiteke. Kasu hauetan ez da gomendatzen erabiltzea.

3.- Bada zenbait kasu, puntuazioek erdialdeko joera garbi azaltzen ez dutena. Aztertutako inongo baliokez du ordezkatuko behar bezala taldearen balioa.

Beraz, puntuazio hauek baldin baditugu: 1, 7, 59, 358, 575

Ez dago modarik, batezbestekoa 200 da eta mediana 59. Taldea ongi “ordezkatuko” duen baliorik ezdagoela ikus dezakegu.

4.- Elementu-talde batean, muturreko edo balio arraro asko daudenean, joera zentralik egokiena medianaizan daiteke.

5.- Banaketa simetrikoa denean, batezbestekoa eta medianak bat egingo dute.

6.- Moda edozein eskalatan neurtutako datuekin erabil daiteke. Mediana kalkulatzeko, gutxienez, eskalaordinal bat beharko dugu, eta batezbestekoarentzat, gutxienez, tartekako eskala bat.

2.3.2. Banakako posizioko neurriak (indizeak)

Zenbaitetan, aldagai baten balio absolutuek, ez dute aztertzen ari garen ezaugarriari buruzko informazioaski eskaintzen.

Md = 25.5+

59

220

12*6 = 25.5 + 4.75 = 30.25

46

Page 59: Estatistika teoria eta praktika SPSSWIN erabiliz

Adibidez, pertsona batek 60 galderez osatutako test batean 32 galdera zuzen erantzun dituela esatenbadidate, ez dakit emaitza ona den ala ez. Neurri handi batean, testaren zailtasunaren arabera egongoda...

Batzuetan, hobe da petsona batek % 70 baino puntuazio hobea lortu duela jakitea, bere emaitzaerreala jakitea baino: adibidez 32 galdera zuzen. Pertsona baten emaitzak konparatzeko erreferentzi taldebat izatea garrantzitsua da. Hobe da % 95ek gainditzen duen emaitza lortu duela jakitea, 37 galdera ongierantzun dituela jakitea baino.

Gai hauetaz hitz egiten dugunean (biztanleriaren % 65 baino gehiago, % 37 baino gutxiago,...)pertzentilaz ari gara.

Orokorrean, dagokion taldearekiko pertsona baten puntuazioa azaldu nahi badugu, modurik errazenapuntuazio guztiak ordenatu eta erreferentzi taldearen barruan gure subjektuak betetzen duen lekuaadieraztea litzateke. Informazioa osatua geratuko litzateke, ordena adieraztearekin batera konparatzendugun jende-kopurua adieraziko balitz. Honela, baiezta dezakegu, 30 pertsonaren artean pertsona batekbederatzigarren puntuaziorik onena atera duen, edo 3.000 pertsonaren artean bederatzigarrenpuntuaziorik onena lortu duen ez dela berdin. Kasu batean subjektuen % 70 gainditzen duen puntuazioalortzen du, bigarren kasuan subjektuen % 99,7 gainditzen duen bitartean. Kasu hauetan 70 eta 99,7pertzentilez arituko ginateke, hurrenez hurren.

Testuinguru honetan medianaren balioa sar dezakegu, 50 ordena edo mailako Pertzentila bezala hardezakegularik; bere ezkerrean subjektuen % 50 eta bere eskuinetan beste % 50 uzten duelako.

2.3.2.1.1. Pertzentilak

Pentsa dezagun txikitik handira ordenatuta dagoenpuntuazio-multzo bat dugula eta 100 zatitan ba-natzen dugula. (3.000 puntuazio baditugu, txikitikhandira ordenatu eta 30 pertsonako 100 zati egi-ten ditugu). Zati hauetako bakoitza zentila izangoda eta 100 zati hauetako bakoitza mugatzen dutenpuntuazioa berriz, Pertzentila. Eta zenbaki batgehituko diegu. Adibidez, 27. pertzentila bere az-pitik 27 lehen zatiak uzten dizkidan balioa da.Hau da, puntuazio-taldearen % 27a.

Eguneroko bizitzan pertzentilekin topatzengarenaren adibide bat edo beste azalduko dugu.Ikus dezagun guztiz inplikatua sentitzen naizenadibide bat: nire alaba (Amaia) jaio zenean,tarteka pediatrarengana joan ohi ginen, haurrarenosasun-egoera eta hazkuntza zaintzearren. Aldibakoitzean aldagai ezberdinak behatzen zitueneta horien artean: pisua, altuera eta garezurrarenperimetroa. Pediatrak emaitza ematen zigun:3,500 kilo, 3,760 kilo..., baina datu horrek ezzigun gizena edo argala zegoen ondorioztatzenuzten, ezta hazi zen edo ez. Halere, puntuaziohauek Osakidetzako Haurraren Osasun-Kartilakokoadrora pasatzeak, gure alabaren hazkuntza-pro-zesuaren erreferentzia garbia izaten lagunduzigun. Prosezu honek denboran zehar aurrera egindu, eta orain, 6 urte dituenean, bere lehen 2urteetako altuera eta pisuaren eboluzioa erakustendu.

47Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

ALTUERA

PISUA

ADINA (HILABETEAK)

NESKAK: 0-2 urteALTUERAPISUA

IZENA....................................................................................................

Zka. .................................................. Jaiotza-data .............................

Amaia91 - 2 - 11

Page 60: Estatistika teoria eta praktika SPSSWIN erabiliz

Ikus ditzagun interpretazio-arauak.

Jaio zenean, 2,800 kilo eta 51 cm zituela ikus dezakezu. Altueran 75. pertzentilean (luze samarra)jauzten da bere luzera, pertzentil honi dagokionaren gainean, baina pisua 3. eta 10. pertzentilen arteandago, hauen bi lerroen artean (nahiko mehea). Dagozkion pertzentilak eskuinaldean, lerro gaineanidatzita dituzu. Jarraitu lerroa eta banda ezkerralderarte eta kitto.

Pixkanaka-pixkanaka pisua irabazten joan zen eta 3 hilabete egin zituenean, bere pisua 6 kilokoa zen,ia 50. eta 75. pertzentilen artean kokatzen zen. Bere adineko neskatilekin konparatuz erditik gora. Noski,altueran nahiko goian zegoenez (90. pertzentilean), altuera eta pisua, biak batera kontuan hartuz mehesamarra zegoela esan genezake, baina... tira.

10 hilabetekin gaixoaldi bat izan zuen eta 200 gramo galdu zituen, ez dirudi asko denik, bainapertzentilean dexente bajatu zen; gauza bera gertatu zitzaion 15 hilabeterekin (hazizurriak) 800 gramogaldu zituenean, eta pertzentiletan banda oso bat erori zen behera.

Altueran, ez du inolako gorabeherarik izan. Noski, hemen kontuan eduki behar dira erabilitakoneurketa-tresnaren zehaztasuna, neurtzailearen trebetasuna eta umea beti geldirik ez dela egoten ere,...baina arazo hauek, edo antzerakoak, nahiko ohizkoak izaten dira giza zientzietan.

Eta honela jarrai dezakezu nire alabaren 2 lehenengo urteetako hazkunde-prozesua. 2 urtekin altuerannahiko ondo zegoen (90. pertzentilean), altu samarra, eta pisuan (50. pertzentilean) bere adinekoneskatilekin konparatuz erdialdean. Hori bai, altuera eta pisua, biak batera kontuan hartuta, bai, piskatxobat iharra nire alaba!!!

Ikus dezakezu era honetako grafiko bat oso lagungarri dela, ni bezalako guraso batentzat, ez baitakitzein den ume baten ohizko pisua eta altuera adin ezberdinetan. Orain, dagozkion pertzentilak jartzenbadizkidate...

Bestalde, aldagai bien azterketa isolatua egiteko baliagarri izateaz gain, bien arteko erlazioa aztertzekoere oso baliagarri izan daitekeela ikusteko aukera izan duzu.

Ondoren, ikus dezagun pertzentil hauen kalkulu-prozesua zein den.

2.3.2.2. Kalkulu-prozesua. Aldagai diskretuak eta tartekakoak

• Aldagai diskretuak (taldekatu gabeko datuak)

Aldagaia diskretua den kasurako, prozesua oso sinplea da; gure subjetuak lortu duen puntuazioa bainobaxuagoa atera dutenen kopurua zenbatu eta dagokion portzentaia kalkulatzea aski da. Ikus dezagunadibide bat. Gaiaren hasieran aztertu dugun taula berreskuratuko dugu.

Xi ni na pi = ni/N pa = na/N

2 2 2 .022 .022

3 7 9 .077 .100

4 14 23 .155 .255

5 21 44 .233 .488

6 16 60 .177 .666

7 12 72 .133 .800

8 9 81 .100 .900

9 8 89 .088 .988

10 1 90 .011 1.000

N=90 1.000

48

Page 61: Estatistika teoria eta praktika SPSSWIN erabiliz

49Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Bi galdera posible egin daitezke. Biak simetrikoak dira.

Lehenengoa, puntuazio jakin bat baino baxuagoak lortzen dituztenen portzentaia kalkula ote liteke?Adibidez, 7 baino baxuagokoak. 2,3,4,5 eta 6 punturekin dauden pertsonak zenbatzen ditugu: 60. Pertso-na-kopuru hau zati talde osoa osatzen duten kopurua (90) egiten badugu eta bider 100 egin, 7 baino pun-tuazio baxuagoa lortu dutenen portzentaia izango dugu: % 66,6.

Bigarrengoa, bere azpitik puntuazioaren % 40 uzten duen balioa kalkula ote liteke? Hau da, 40.pertzentila kalkulatzea, alegia.

Gai honekin hasi aurretik, % 40 zenbatek osatzen duten kalkulatu beharko dugu. Gure kasuan,kalkulu sinple batek 36 pertsona direla esaten digu. Orain, ordenatu ondoren 36. eta 37. lekuan geratzendirenek dituzten balioak zein diren kalkulatzea baino ez da geratzen. Biek 5 balioa dutela ikusten dugu,2 pertsona baitaude 2 puntuazioarekin, zazpi 3 puntuazioarekin (3. eta 9. postu tartean ordenatuakdaude), 14 4arekin (10. eta 23. postuen artean ordenatuak) eta 21 5 puntuazioarekin (24. eta 44. postuenartean ordenatuak). Beraz, 36. eta 37. postuak betetzen dituzten pertsonek 5 puntuazioa dute. Hau da 40.pertzentilaren balioa.

• Tartekako aldagaiak (datu taldekatuak)

Aldagai diskretuen kasuan egindako bi galderetako edozein erantzuteko beharra bada, hauek jarraiakbadira, ondorengo formula erabili beharko da, non Pk, K ordenako pertzentila den.

Non:k : pertzentilaren ordena edo maila den.Li : pertzentila edo interesatzen zaigun balioa kokatzen den tartearen azpiko muga den.Ii : tartearen zabalera den.Ni-1 : aurreko tarteraaino metaturiko maiztasuna.N : maiztasun osoa, edo elementu kopurua den.ni : tartearen maiztasuna den.

KONTUZ! Aurreko formulan, puntuazioak TXIKITIK HANDIRA ordenatuta daudela suposatukodugu.

Formula honen eta medianaren kalkulurako erabilitakoaren antzekotasunaz ohar gaitezke, izan ere,hura hemen aurkezten dugun formularen kasu berezi bat baita, n=50 den kasurako. Irakurleak formulenarteko baliokidetasuna froga dezake.

Formula osoan, pertzentila kokatzen den tarteari egiten zaio erreferentzia. Tarte honen kalkuluaaurrena egin beharrekoa eta erabakiorra izango da prozesu guztian. Ikus dezagun kasu praktiko bat,horretarako, aurrez kapitulu honetan azaldu dugun adibidea jasoaz:

Benetako mugak Itxurazko mugak ni Tarte-ordezkaria Mi

1.5 – 7.5 2 – 7 1 4.5 1

7.5 – 13.5 8 – 13 4 10.5 5

13.5 – 19.5 14 – 19 5 16.5 10

19.5 – 25.5 20 – 25 10 22.5 20

25.5 – 31.5 26 – 31 12 28.5 32

31.5 – 37.5 32 – 37 10 34.5 42

37.5 – 43.5 38 – 43 8 40.5 50

43.5 – 49.5 44 – 49 9 46.5 59

59

Pk = L +

N * k

100N

n* Ii

i -1

ii

Page 62: Estatistika teoria eta praktika SPSSWIN erabiliz

Planteatzen ditugun bi galderak hauek dira:

Zein da subjektuen % 60 baino puntuazio handiagoak lortzen dituen subjektuaren puntuazioa? eta

Zein subjekturen portzentaiak lortzen du 27 puntu baino gutxiago?

Galdera biak erantzuteko aurreko formula erabiliko da, baina modu ezberdinean.

Lehenengo kasuan, 60 ordena edo heineko pertzentila kalkulatu behar da: P60.

Pertzentilen kalkulurako formula aplikatu nahi den guztietan, bila gabiltzan pertzentila zein tartetankokatzen den jakin beharko da. Gure kasuan 60 pertzentila kalkulatu behar dugu, hau da, bere azpitik %60 uzten duen puntua (59ren % 60a): 35.4 pertsona, alegia. 35. lekuan eta 36. lekuan kokaturikopuntuazio ordenatuak muga errealen tarte honetan kokatzen dira: 31.5-37.5.

Honekin, formula aplikatzeko garaian, tartearen beheko muga 31.5 dela, zabalera 6 unitatekoa dela,tartearen maiztasuna 10 pertsonakoa dela, eta tarte hau baino lehenago metatutako maiztasuna 32koadela badakigu.

nondik

Horrela, subjektuen % 60 bere azpitik uzten duen puntuazioa 33.54 dela baiezta genezake.

Gogora dezagun orain bigarren galdera: 27 puntu baino gutxiagoko puntuazioa duten subjektuenportzentaia kalkulatzea. k balioa kalkulatzean datza, Pkren balioa “27” dela jakinik.

Kokatzen den tartea zehazteko arazorik ez dugu, maiztasunen sailkapenean emana baitatorkigu: 25.5- 31.5. Tartearen zabalera ere ezaguna da: 6 unitate, horreraino metatutako maiztasuna: 20 pertsona, etalan-tartearen maiztasuna: 12 pertsona. N:59ren balioa ere ezaguna da. Arazoa k-ren (pertzentilarenordena edo heinarena) balioa kalkulatzean datza, era berean bere kalkulua gure arazoaren helburuadelarik.

Gure kasuan eta balioak formulan ordezkatuz, honakoa lortuko dugu:

Hemendik, K -ren balioa argituz, zera lortuko dugu:

Beraz, baiezta genezake % 38.98k 27 puntu baino gutxiago lortzen duela.

100 * [3 + 20]

59= k = 38.98

1.5* 12

6=

59* k

100-20

27 = 25.5+

k

10020

12* 6

59 *−

Pk = 31.5+35.40 -32

10*6 = 31.5+ 2.04 = 33.54

Pk = 31.5+

60

10032

10* 6

59 *−

50

Page 63: Estatistika teoria eta praktika SPSSWIN erabiliz

Posizioko beste indizeak: dezilak eta koartilak

Pertzentilen kasuan subjektu guztiak 100 ataletan zatitu ditugu, zati horietako bakoitzari zentil deituz.Zentil desberdinak zatitzen zituzten puntuei berriz: pertzentilak. Badira 10 ataletan zatitzen diren kasuakere eta zatiketa hauetako bakoitzaren mugei Dezil deituko diegu. Dezil ezberdinei, berriz, D1,D2,D3,...

Besteetan lau ataletan zatitzen dira eta lau ataletako muga bakoitzari Koartil deituko diogu. Koartildesberdinei, berriz, Q1,Q2,Q3,..

Dezil eta koartilen kalkuluak egiteko pertzentilen formulaz baliatuko gara, pertzentil, dezil etakoartilen arteko baliokidetasun hauek kontuan izanik:

D1 = P10D2 = P20

Q1 = P25D3 = P30D4 = P40D5 = Mediana = Q2 = P50...D9 = P90

2.3.3. Aldakortasun- edo sakabanatze-neurriak (Indizeak)

Aurreko atalean, datuen lehen deskribapen bat egiten laguntzen diguten, Joera zentraleko neurriezberdinak aztertu ditugu, nolabait puntuazioen zentrua edo erdiko balorea zein den azalduz. Halere,neurri hauek ez dira aski. Ikus dezagun:

Hiru puntuazio-talde hauek ditut:

A: 48, 49, 50, 51, 52 batezbestekoa = 50

B: 46, 48, 50, 52, 54 batezbestekoa = 50

D: 40, 45, 50, 55, 60 batezbestekoa = 50

Hiru kasuetan batezbestekoa berdina da; aldiz, B taldeko datuak A taldekoak baino askozsakabanatuagoak daude eta A eta D taldekoak, era berean, A eta B taldetakoak baino askoz gehiago. Dtaldeko puntuazioak B eta A taldetakoak baino aldakorragoak dira.

51Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

D0D1 D2 D3 D4

D5D6 D7 D8 D9

D10

Q0Q1

Q2Q3

Q4

P0P10 P20 P30 P40

P50P60 P70 P80 P90

P100

P25 P50 P75

Dezilak

Koartilak

Pertzentilak

Page 64: Estatistika teoria eta praktika SPSSWIN erabiliz

Atal honetan aztertuko diren sakabanatze-neurriek datuen arteko tartea (sakabanatzea, alda-kortasuna...) aztertzen lagunduko digute. Aztertzen ari garen elementuen arteko diferentziak zenbaterai-nokoak diren “ikusten” edota aztertzen lagunduko digute. Banakakoen ezberdintasunak aztertzenlagunduko digute.

Aldakortasunerako 5 neurri ikusiko ditugu: Heina, Bariantza, Desbideratze tipikoa, Aldakuntza--koefizientea eta Koartilarteko Ibiltarterdia. Kaxa-diagrama aurkeztu eta aztertuz amaituko dugu atala.

2.3.3.1. Heina

Puntuazioen bariazio osoaren neurri bezala defini daiteke; hau da, puntuazio handien eta txikienarenarteko diferentzia.

A, B eta D puntuazio-taldeak baditut:

A: 48, 49, 50, 51, 52 batezbestekoa = 50

B: 46, 48, 50, 52, 54 batezbestekoa = 50

D: 40, 45, 50, 55, 60 batezbestekoa = 50

A puntuazio-taldearen heina: 52-48 = 4

B puntuazio-taldearen heina: 54-46 = 8

D puntuazio-taldearen heina: 60-40 = 20

D-ko puntuazioak B-koak baina sakabanatu, aldendu edo aldakorragoak dira eta, era berean, hauekA taldekoak baino gehiago.

OHARRA. Diferentzia honi unitate bat gehitzen zaien uneak badira. Arrazoia honakoa da: bi per-tsonen pisuak 62 eta 73 kilo direla esaten denean, lehenengoaren pisua 61.5 eta 62.5en artean dagoelaesaten ari gara, bigarrenarena 72.5 eta 73.5 artean dagoen bitartean. Hau da, 62 eta 73 balioak dagozkientarteko balio zentralak dira. Hauetan, tarteen arteko heina edo diferentzia erreal osoa: 73.5 – 61.5 = 12litzateke.

Emaitza hau zuzenean lor dezakegu, 73 eta 62 pisuen arteko diferentziari unitate bat gehituz(73 – 62 = 11 + 1 = 12).

2.3.3.2. Bariantza eta desbideratze tipikoa

Aldagai baten puntuazioen aldakortasuna neurtzeko erabilgarri suertatzen den modu bat, hurrenezhurreneko balioetatik “zutoin zentral” batera doazen distantziak neurtzea da; “zutoin zentral” bezalanormalki, batezbestekoa erabiltzen da.

Zutoin zentralarekiko (batezbestearekiko) distantziak kalkulatzen baditut, honako emaitzak lortukoditut:

DISTANTZIAK

A: -2, -1, 0, 1, 2 Distantzien batura = 0

B: -4, -2, 0, 2, 4 Distantzien batura = 0

D: -10, -5, 0, 5, 10 Distantzien batura = 0

A-ren distantziak B eta D-renak baino txikiagoak direla ikusten da.

Distantzien arteko batura kasu bakoitzean 0 dela ere ikus daiteke. Hau batezbestekoaren ezaugarrigarrantzitsu bat da. Beraz, ezingo dugu ezertxo ere egin distantzien baturarekin, beti 0 baita.

52

Page 65: Estatistika teoria eta praktika SPSSWIN erabiliz

Arazo hau askatzeko soluzio ezberdinak plantea daitezke.

Lehenengoa, distantziaren zeinua kentzea da; denak positibo jartzea (egite honi diferentziak balioabsolutuan jartzea deritzo). Prozedura honen bidez, balio absolutuan hartutako distantzien batezbestekoakalkulatuz, BATEZBESTEKOEN DESBIDERATZEA (DM) izenekoa lortuko genuke, bere formula honakoadelarik:

Gure hiru datu-multzoetako emaitzak hauek dira:

DISTANTZIA ABSOLUTUAK

A: 2,1,0,1,2 Distantzien batura = 6, eta DM = 6/5 =1.2

B: 4,2,1,2,4 Distantzien batura =12, eta DM = 12/5 = 2.4

D: 10,5,0,5,10 Distantzien batura =30, eta DM = 30/5 = 6

Bigarrengoa, BARIANTZAren sorrera ematen duena, distantzia bakoitza karratura jaso, horrela zeinuakenduz, eta hauen batezbestekoa kalkulatzean datza.

DISTANTZIEN KARRATUAK eta BATURA:

A: 4, 1, 0, 1, 4 Distantzien karratuen batura = 10

B: 16, 4, 0, 4, 16 Distantzien karratuen batura = 40

D: 100, 25, 0, 25, 100 Distantzien karratuen batura = 250

Eta hemendik bariantzak lortuko ditugu, S deituko ditugunak, eta gure kasuan S2a, S2b, S2d izendatukoditugu A, B eta D taldeen bariantzak, hurrenez hurren.

BARIANTZA = DISTANTZIEN BATEZBESTEKOA KARRATUA:

A: Bariantza = S2a = 10/5 = 2

B: Bariantza = S2b = 40/5 = 8

D Bariantza = S2d = 250/5 = 50

B taldeko bariantza (8) Akoa baino handiagoa dela ikus dezakegu (B taldeko datuak Akoak bainosakabanatuagoak daude) eta D taldeko bariantza (50) Bkoa (8) eta Akoa (2) baino handiagoa dela ikustendugu (D taldeko datuak B eta Akoak baino sakabanatuagoak baitaude).

Datuak, zenbat eta sakabanatuagoak egon, orduan eta bariantza handiagoa izango dute.

Bariantza kalkulatzeko, hau da, aurreko adibidean eman ditugun pausoak laburtuko dizkigun formulabezala, bariantzaren formula bezala, honakoa erabiliko dugu:

Horrela, matematikako puntuazio hauen bariantza kalkulatzeko (8, 3, 6, 5, 4, 5, 9, 8), lehenik,batezbestekoa kalkulatuko dugu, gure kasuan 6; ondoren formula aplikatu eta honako hau lortuko dugu:

x2 i

2 2 2 2

S =( X - X )

n=

(8 - 6 ) +(3 -6 ) +...(8 - 6 )8

x2 i

2

S =( X - X )

n∑

D. M.=| X - X|

ni∑

53Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 66: Estatistika teoria eta praktika SPSSWIN erabiliz

Beraz, kasu honetan, bariantzaren balioa 4 da.

Baina batzuetan, bariantzaren emaitzek zertxobait despistatu egiten gaituzte: Nola interpretatuko dutD datu-multzoko bariantza 50 izatea? Zein da balio honen benetako esanahia?

Distantzien karratuekin lan egiteak, bariantzaren balioa interpretatzea zaildu egiten du. Gauzak askosinplifikatuko dira DESBIDERATZE TIPIKOAREKIN lan egitean.

Bariantza, puntuazio ezberdinetatik hasi eta balio hauen batezbestekora dauden distantzi karratuenbatezbestekoa bezala defini genezake. Beraz, bariantza DISTANTZIEN KARRATU BATZUEN batezbes-tekoa da.

Karratura jasoak dauden distantziekin lan egiteak sor lezakeen nahasketa deusezteko, DESBIDERATZETIPIKOArekin lan egingo dugu. Hau, zuzenean, bariantzatik lortuko dugu bere erro karratua kalkulatuz.Sx bezala izendatuko dugu. Hau lortzeko formula da honako hau:

Bere balioa, aurreko hiru kasuetan honako hau da:

A: 48,49,50,51,52 batezbestekoa = 50 Bariantza = 2 Des.Tip. = 1.41

B: 46,48,50,52,54 batezbestekoa = 50 Bariantza = 8 Des.Tip. = 2.82

D: 40,45,50,55,60 batezbestekoa = 50 Bariantza =50 Des.Tip. = 7.07

Desbideratze tipikoaren interpretazioa argiagoa dela ikus dezakegu. B taldearen desbideratze tipikoaA taldearenaren bikoitza da. IKUS ITZAZU BALIOEN ARTEKO DISTANTZIAK!!! D taldearen desbideratzetipikoa A taldearena baino 5 aldiz handiagoa da. D taldearen distantziak Arenak baino 5 aldiz han-diagoak dira.

Desbideratze tipikoaren propietate teoriko-matematiko garrantzitsuak, hau da, emaitza interpretatzekoerraztasuna eta, batez ere, aztertzen ari garen ezaugarrietan bariazioek islatzen dituzten datuen arteanbariazioak analizatzearen garrantziak, Gizarte-zientzietara bideratutako Estatistikan DESBIDERATZETIPIKOA oso neurri erabilia izatea areagotu egiten du.

OHARRA: liburu askotan bariantza, aurretik ikusi dugun definiziotik desberdin ikusiko dugu: zati n(elementu-kopuruagatik) egin beharrean, zati n-1 egingo da. Balio honi KUASIBARIANTZA deritzo. Ezgara aldaketa honen abantailak aztertzeko adina sartuko Estatistikan. Oraingoz aukera honen aipamenabesterik ez nuen egin nahi. Aukera hau gainera, kalkuluak egiteko garaian WINDOWSentzako SPSSkerabiltzen duena da.

2.3.3.2.1. Bariantza eta desbideratze tipikoaren kalkulu eta ezaugarriak

Bariantzaren kalkulurako, beraien artean baliokideak diren 4 formula erabiltzen dira, ondoren deskri-batuko direnak.

Aurrenengoa lehentxeago ikusitakoa da:

Formula 1:

x2 i

2

S =( X - X )

n∑

x x2 i

2

S = bariantza = S =( X - X )

n∑

x2S =

4+ 9 +0 +1+4 +1+ 9 +4

8=

32

8= 4

54

Page 67: Estatistika teoria eta praktika SPSSWIN erabiliz

Bigarrengoa, datuak taldekatuak ez daudenean ere erabiliko dena:

Formula 2:

Datuak maiztasun-taula batean taldekatuak diren kasuetan, formulak, honakoak dira:

Formula 3:

Formula 4:

Ikus ditzagun, datuak maiztasun-taulan taldekatuak daudeneko bi adibide, formula bakoitzeko bana:

Lehenik aplikatuko dugu:

Xi ni Xi*ni X2i * ni

2 2 4 8

3 7 21 63

4 14 56 224

5 21 105 525

6 16 96 576

7 12 84 588

8 9 72 576

9 8 72 648

10 1 10 100

90 520 3308

Gure kasuan emaitza hau da:

Hurrengo kasuan, 4. formula erabiliko dugu. Aldagai jarrai baten maiztasunen sailkapen bati, edotartetan taldekatutako datuei, dagokio; zeinetan, lehen esan bezala, lehen pauso bat eman behar dugun:klase-markak definitzea. Gogora dezagun klase-markak berauen ordezkari direla eta balio hauek izangodira tarte bakoitzeko elementuen balioen batura kalkulatzeko erabiliko ditugunak.

Horrela, gai honen lehen orrialdeetan aurkeztu ditugun kasuko datuak aztertuz eta 4. formula erabiliz:

x2 i i

2

i

i i

i

2 2S = n * X

n- [ n X

n] =

3308

90- (

520

90) = 36.75 - 33.38 = 3.37

x2 i i

2

i

S = n * ( X - X )

n

x2 i i

2

i

i i

i

2S = n * X

n- [ n X

n]

x2 i

22

S = Xn

- X∑

55Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 68: Estatistika teoria eta praktika SPSSWIN erabiliz

ni Tarte ordezkaria: ni * Xi Xi – X (Xi – X)2 ni *(Xi – X)2

Xi Xi – 30.22

1 4.5 4.5 –25.72 661.52 661.52

4 10.5 42 –19.72 388.88 1555.52

5 16.5 82.5 –13.72 188.24 941.20

10 22.5 225 –7.72 59.60 596.00

12 28.5 342 –1.72 2.96 35.52

10 34.5 345 2.28 5.20 52.00

8 40.5 324 10.28 105.68 845.44

9 46.5 418.5 16.28 265.04 2385.36

59 1783.5 7072.56

Nondik:

Ezaugarriak:

1.- Bariantza eta desbideratze tipikoa balio positiboak dira; ezin dira inoiz negatiboak izan.

Subjektu artean dauden distantzien (Desbideratze tipikoaren) batezbestekoa ematen digute, beraz ezindute negatiboak izan. Bariantza, berriz, distantzia karratu batzuen batezbestekoa da. Hau erepositiboa izango da.

2.- Puntuazio-talde bati konstante bat gehitzen badiogu, bere bariantza eta desbideratze tipikoak ez diraaldatzen.

Ezaugarri bateko balio guztiei kopuru bera gehitu edo kentzen badiegu balioen arteko diferentziak ezdira aldatzen, ondorioz, bariantza eta desbideratze tipikoa ere ez.

Yi = Xi + K bada, orduan Y -ren bariantza = X -en bariantza.

Adibidez: X -en puntuazio bakoitzari, 10 gehitzen badiot, balioen arteko distantziak ez direla aldatzenikus dezakezu.

Puntuazioak: 5,7,9,6,8,6,8 Bariantza = 12/7 = 1.7142

Puntuazio berriak:15,17,19,16,18,16,18 Bariantza berria=12/7

3.- Puntuazio-talde bat bider konstante bat egiten badugu, desbideratze tipikoa konstantearen balioagatikbiderkatua geratuko da. Bariantza konstantearen karratuagatik biderkatua geratuko da.

Yi = K+Xi bada, Y -ren desbideratze tipikoa = K* X -en desbideratze tipikoa

orduan Y -ren bariantza = K2* X -en bariantza

Adibidez: X -en puntuazio bakoitza bider 10 egiten badugu, balioen arteko distantziak ere 10 aldizhandiagoak direla ikus dezakezu. Ondorioz, desbideratze tipikoa 10 aldiz handiagoa eta bariantza100 aldiz handiagoa izango dira.

Puntuazioak: 5,7,9,6,8,6,8 Bariantza = 12/7 = 1.7142

Des. Tipikoa = 1.309

Puntuazio berriak: 50,70,90,60,80,60,80 Bariantza berria = 1200/7 = 171.42

Des. Tipikoa = 13.09

x2 i i

2

i

S = n * ( X - X )

n=

7072.56

59= 119.87

56

Page 69: Estatistika teoria eta praktika SPSSWIN erabiliz

2.3.3.3. Aldakuntza-koefizientea

Zenbaitetan, bi puntuazio-talderen edo bi aldagaien aldakuntza edo sakabanatze-maila konparatzeainteresatzen zaigu.

Arazo honek ez du zailtasun handirik, bi puntuazio-taldeak edo bi aldagaiak neurri-eskala bereandaudenean, desbideratze tipikoak edota bariantzak konparatuko ditugu. Badakigu bariantza zenbat etahandiagoa izan, datu-taldearen aldakuntza handiagoa dela.

Arazoa bi aldagaiak (edo puntuazio-taldeak) eskala desberdinez neurtzen direnean sortzen da. Ikusdezagun adibide bat. Bi maisuk 10 ikasleri nota berberak jartzen dizkiete, baina batek 0tik 10erapuntuatzen duen bitartean, besteak 0tik 100era puntuatzen du.

Puntuazioak honakoak dira:

A:7,5,6,4,5,6,6,8,4,9 Media = 6Bariantza = 2.4 Desbideratze tipikoa = 1.5

B:70,50,60,40,50,60,60,80,40,90 Media = 60 Bariantza = 240Desbideratze tipikoa= 15

Itxuraz, B maisuaren datuak A maisuarenak baino sakabanatuagoak daude, puntuazioak eta berauenarteko diferentziak baliokideak direla begi bistakoa denean. Egoera hau askatzekoALDAKUNTZA-KOEFIZIENTEA-z baliatuko gara, eskala diferenteekin neurtutako aldagaienaldagarritasuna konparatzen utziko digularik.

Formula hau da:

AK -ren balioa, gure bi maisuen puntuazioetan, berdina dela ikus dezakegu.

2.3.3.4. Koartilarteko ibilarterdia

Zenbaitetan, muturretako balioek bariantza eta desbideratze tipikoaren balioak nahas ditzakete.Ondorioz, hauek ez dute behar bezala gure datu-multzoaren aldagarritasuna ordezkatzen, edota ez duteadierazten gure datu-multzoko benetako sakabanatze-maila.

Kasu hauetan koartilarteko ibiltarterdia erabil dezakegu, izenak berak dioen bezala, Q3 eta Q1koartilen arteko distantziaren erdia kalkulatuz lortzen dugu. Izendatzeko Q letra erabiliko dugu, eta bereformula hau da:

Q=Q3- Q1

2

BAk =15

60* 100 = 25

AAk =1.5

6*100 = 25

Ak =Sx

X*100

57Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 70: Estatistika teoria eta praktika SPSSWIN erabiliz

Ikus daitekeen bezala, sakabanatze-indize hau kalkulatzean ez da kontuan hartzen balio arrarotik edomuturreko baliotik batezbesterainoko distantzia. Indize honetan erdiko balioak bakarrik ditugu kontuan,eta joera zentraleko neurri bezala mediana erabiltzen den kasu haietan erabiliko da.

Azken aldian, estatistika aztertzailearen eta kaxa-diagramen erabilpena areagotzearekin batera,koartilarteko ibiltarterdia, edo bere kasuan koartilartekoa (2Q), “puri-purian” dagoen indize bezala hardezakegu.

2.3.3.5. Kaxa-diagrama: aldakortasunaren irudikapena

Sailkapen baten erdiko balioaz gain (mediana), honen aldakortasuna grafikoki agertzeko, kaxa-diagramazbalia gaitezke.

Bi puntuazio-talde edo gehiagoren aldakortasuna konparatzeko erabiltzen da, batik bat.

Hurrengo grafikoan, SPSSWIN paketearekin egina, horren adibide bat dugu. Matematikako notenarabera zatitzen dugun talde bakoitzean RAVEN aldagaiaren emaitzak konparatzean datza gure lagina.

Hurrengo diagrama lortzeko eman diren pausoak hauek dira:

GráficosDiagramas de caja

(simples)Definir...

Eta ondoren “Variables”-en: RAVEN

Eta “Eje de Categorías”-en: NOTAMATE

Eta honen antzeko leihoa lortuko da:

Aukeretan (Opciones), galdutako datuak azaltzerik ez badugu nahi, botoia desaktibatu egin beharkodugu: Ver grupo definido por valores perdidos. Continuar.

Aceptar.

Ondorengo grafikoa hau da:

58

Page 71: Estatistika teoria eta praktika SPSSWIN erabiliz

Bost kaxetan NOTAMATE aldagaiaren kategorian subjektuei dagokien informazioa azaltzen da.

Ardatz horizontalean (abszisan) kategorien izenak eta bakoitzean dauden pertsonen kopurua azaltzenda.

Zutabe bakoitzean muturretako balioak, mediana eta koartilak aurkezten dira.

Kaxa bakoitzak kategoriaren balioen % 50 dauka, 3. eta 1. koartil artekoak, kaxaren goiko ertza 3.koartila eta beheko ertza 1. koartila direla.

Kaxa bakoitzaren erdian, marra lodiagoz, mediana azaltzen da. Kaxaren altuera koartilarteko ibilbideada. Gogora ezazu, sakabanatze-indize bezala ibilbide honen erdia erabiltzen dela: ibiltarterdia, Q.

Matematikako nota gehituz doan neurrian, Raven-en batezbestekoa handituz doala ikus daiteke. Eraberean, lehenengo kategoriatik azkenengoraino, koartilarteko ibilbidea piskatxo bat gutxitu egiten da.

EZ GAI-ri dagokion kaxan, lehenengoan, medianak 50 baino balio handixeagoa du, Q3k 54 balio dugutxi gorabehera eta Q1ek ia 46, goiko baliorik handiena 60 eta behekoa 37 inguruan dauden bitartean.Zutabearen behe-mugatik behera ere bi zirkulu txiki eta bi zenbaki agertzen dira. Bi balio arraro “outlieredo extremes” izenekoak aurkezten dizkigu. Zergatik arraroak? Nolabait, erdiko puntutik oso urrundaudelako. Urruntasun hau honela definituko dugu: batezbestekotik bi desbideratze tipiko baino gehiagodesbideratzen direnak.

Gainontzeko kategorien kaxak pauso hauek berak jarraituz azter daitezke.

2.3.4. Formari buruzko indizeak: asimetria eta kurtosia

Joera zentraleko neurriez gain (banaketaren erdiko balioak zein diren aztertzeko erabilgarriak) etasakabanatze- edo aldakortasun-neurriez gain, aldagaiak deskribatzen lagunduko diguten bi neurri-motaerabiliko ditugu: asimetria- eta kurtosia-neurriak dira.

Asimetria-neurriek gure datuak batezbestekotik noraino goi eta behealdera modu orekatuan banatzendiren aztertzen laguntzen dute. Beste era batera esanda, gure datuen banaketa zenbateraino densimetrikoa adierazten dute.

Ondoren hiru histograma ikus ditzakegu; bata asimetria negatiboa duena, bestea simetrikoa etahirugarrena asimetria positiboa duena.

59Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

27494759115N =

NOTAMATE97653

RA

VE

N

70

60

50

40

30

20

44

72

26054

226

RAVEN

Page 72: Estatistika teoria eta praktika SPSSWIN erabiliz

60

6,05,04,03,02,01,0

Histograma

Fre

cuen

cy

10

8

6

4

2

0

Std. Dev = 1,50

Mean = 4,6

N = 25,00

ASIMETRIkoef = -0.847

ASIMETRI koef = 0.000

9,08,07,06,05,04,03,02,01,0

Histograma

Frec

uenc

iy

uency

6

5

4

3

2

1

0

Std. Dev = 2,04

Mean = 5,0

N = 25,00

6,05,04,03,02,01,0

Histograma

Fre

ncue

ncy

ency

10

8

6

4

2

0

Std. Dev = 1,50

Mean = 2,4

N = 25,00

ASIMETRI koef = 0.847

Histograma: asimetria negatiboa

Histograma: simetria

Histograma: asimetria positiboa

Page 73: Estatistika teoria eta praktika SPSSWIN erabiliz

Lehenengo kasuan, ASIMETRIA NEGATIBOAN, koefizienteak – 0.847 balio du eta, batezbestekoamoda baino txikiagoa da; bigarrengoan ASIMETRIA = 0, batezbestekoak modarekin bat egiten du, etahirugarrengoan, ASIMETRIA POSITIBOAN, batezbestekoa moda baino handiagoa izango da eta asime-tria-koefizienteak + 0.847 balio du.

Asimetria positiboko adibide lirateke honakoak: oso azterketa zaileko notak, lantegi bateko soldatak,...; batezbestekoa gainditzen duten balio gutxi daudenekoak. Asimetria negatiboaren adibide lirateke,bestalde, azterketa erraz bateko notak edo kirol-ikuskizun batean, partidua hasi baino lehen, kiroldegiraminutuz minutu iristen den ikusle-kopurua.

As izenarekin ezagutuko dugun asimetria-koefizienteak, gure banaketaren asimetria-mota adierazikodu, eta koefizientearen handitasunak bere asimetria-gradua. Hau da, As-ren balioa 0tik zenbat etahurbilago egon, orduan eta hurbilago egongo da banaketa simetria osotik.

KURTOSIA banaketa-kurbaren zorroztasun-maila kalkulatzen laguntzen duen neurria da.

Banaketa bat MESOKURTIKOA dela esango dugu bere zorroztasun-maila banaketa normalarenantzekoa denean (5. gaian sakonki aztertuko dugun banaketa) eta kurtosiaren balioa 0ren hurbilekoadenean.

Zorroztasun-maila edo gradua kurba normala baino handiagoa bada, banaketak kurtosi POSITIBOAizango du eta sailkapena LEPTOKURTIKOA dela esango dugu.

Azkenik, zorroztasun-maila normalarena baino txikiagoa bada (lauagoa bada) PLATIKURTIKOA delaesango dugu. KurtosiA negatiboa izango da.

2.4. SPSSWINen EMAITZAK

Atal honetan aztertu diren neurri ezberdinak Windowserako SPSS programa paketea erabiliz lor daitezke;bere erabilera liburu honen azken gaian azalduko da. Ondoren, pakete honekin lortuko diren emaitzakdeskribatuko dizkigun adibide-pare bat azaltzen dugu.

1.– MAIZTASUNAK

Emaitza hauek lortzeko, behin LIBURU.SAV datu-fitxategia kargatu ondoren, honako hautaketa-prozesuaegin beharko da:

EstadísticosResumir

Frecuencias...

Eta ondorengo pantaila lortuko da, non RAVEN aldagaiari dagozkion eta ondoren aurkezten direnemaitzak lortzeko, aipatu aldagaia hautatu eta Variables-en jarri den.

61Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 74: Estatistika teoria eta praktika SPSSWIN erabiliz

Ondoren Estadísticos botoia sakatu eta honako leihoa agertzen zaigu, non gurutze batekin markatuakdauden aukerak hautatu ditugun. Ikus ditzagun: Cuartiles (Koartilak), Desviación típ. (desbideratzetipikoa), Varianza (bariantza), Amplitud (Luzera), Mínimo (Txikiena), Máximo (Handiena), E.T. (erroretipikoa), Media (Batezbestekoa), Mediana, Moda, Suma (Batura), Asimetria eta Kurtosia.

Continuar tekla sakatu eta hasierako pantailaraitzulita, Gráficos-eko botoia sakatuko da,ondorengo leihoa lortzeko, non Histogramas concurva normal aktibatu dudan.

Continuar eta Aceptar sakatu ondoren, bibertsioetan honako emaitzak lortzen ditut:

62

Page 75: Estatistika teoria eta praktika SPSSWIN erabiliz

6.1.3 bertsiorako:

SPSSWIN 6.1.3

RAVEN

Valid Cum

Value Label Value Frequency Percent Percent Percent

30 1 ,3 ,3 ,3

34 3 ,9 ,9 1,2

37 3 ,9 ,9 2,2

39 3 ,9 ,9 3,1

40 5 1,5 1,6 4,7

41 2 ,6 ,6 5,3

42 3 ,9 ,9 6,2

43 5 1,5 1,6 7,8

44 10 3,0 3,1 10,9

45 7 2,1 2,2 13,1

46 9 2,7 2,8 15,9

47 11 3,3 3,4 19,3

48 12 3,6 3,7 23,1

49 18 5,4 5,6 28,7

50 28 8,4 8,7 37,4

51 24 7,2 7,5 44,9

52 22 6,6 6,9 51,7

53 29 8,7 9,0 60,7

54 24 7,2 7,5 68,2

55 23 6,9 7,2 75,4

56 28 8,4 8,7 84,1

57 19 5,7 5,9 90,0

58 10 3,0 3,1 93,1

59 16 4,8 5,0 98,1

60 6 1,8 1,9 100,0

, 14 4,2 Missing

———- ———- ———-

Total 335 100,0 100,0

Mean 51,489 Std err ,297 Median 52,000

Mode 53,000 Std dev 5,326 Variance 28,363

Kurtosis 1,143 S E Kurt ,271 Skewness -,946

S E Skew ,136 Range 30,000 Minimum 0,000

Maximum 60,000 Sum 16528,000

Percentile Value Percentile Value Percentile Value

25,00 49,000 50,00 52,000 75,00 55,000

Valid cases 321 Missing cases 14

63Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 76: Estatistika teoria eta praktika SPSSWIN erabiliz

7.5 bertsiorako

Frecuencias

Maiztasunen banaketari dagokionez, Percent eta Valid percent (Porcentaje eta Porcentaje válido)zutabeen arteko ezberdintasuna honako hau dela gogorarazi nahi dut: lehenengoak pertsona-kopuru osoa(335) zati balio bakoitzaren maiztasuna egiten du. Bigarrengoaren kasuan, berriz, (Valid percent), zatiinformazioa dudan kasu-kopurua egiten du, hau da, galdutako 14 kasuak baztertuz, 321ekin zatituzlortzen dira portzentaiak.

Gainerako balioen deskribapena honako hau da:

BATEZBESTEKOA: Media-Mean 51,489

MEDIANA: Mediana 52,000

MODA: Moda 53,000

DESBIDERATZE TIPIKOA: Desv.tip-Std dev 5,326

BARIANTZA: Varianza 28,363

ERRORE TIPIKOA: Error tip. - Std err ,297 (*)

KURTOSIA: Curtosis 1,143

KURTOSIAren errore tip. Error t. curt- S E Kurt 00,271 (*)

ASIMETRIA: Asimetria -Skewness - ,946

ASIMETRIAREN errore tip.: Error t. asi - S E Skew 00,136 (*)

HEINA: Rango 30,000

64

1 ,3 ,3 ,33 ,9 ,9 1,2

3 ,9 ,9 2,2

3 ,9 ,9 3,15 1,5 1,6 4,7

2 ,6 ,6 5,3

3 ,9 ,9 6,25 1,5 1,6 7,8

10 3,0 3,1 10,9

7 2,1 2,2 13,19 2,7 2,8 15,9

11 3,3 3,4 19,312 3,6 3,7 23,118 5,4 5,6 28,7

28 8,4 8,7 37,4

24 7,2 7,5 44,922 6,6 6,9 51,7

29 8,7 9,0 60,7

24 7,2 7,5 68,223 6,9 7,2 75,4

28 8,4 8,7 84,1

19 5,7 5,9 90,010 3,0 3,1 93,1

16 4,8 5,0 98,1

6 1,8 1,9 100,0321 95,8 100,0

14 4,2

14 4,2

335 100,0

30

3437

39

4041

42

4344

45

4647

484950

51

5253

54

5556

57

5859

60

Total

Válidos

Perdidosdelsistema

Total

Perdidos

Total

Frecuencia PorcentajePorcentaje

válidoPorcentajeacumulado

Tabla de frecuencia RAVEN

Page 77: Estatistika teoria eta praktika SPSSWIN erabiliz

TXIKIENA: Mínimo 30,000

HANDIENA: Máximo 60,000

BATURA: Suma 16528,000 (*)

(*) SPSSWINek aurrez deskribatu ez diren 4 balio aurkezten ditu, izartxoa daramaten lanak, hainzuzen. STD ERR edo Error típico izenarekin errore tipikoa aurkezten du, 6. gaian deskribatuko dena. S EKurt eta S E Skew (error típ.) izenekin, kurtosia eta asimetria-koefizienteen errore tipikoak azaltzen ditu,zeinaren deskribapen eta interesak liburu honen helburuetatik at dauden. Azkenik SUM izenak,aldagaiaren balio guztien batura adierazten du.

Ondoren, grafikoen aukeran histograma egitea eskatu diogunez, 7.5. bertsioan grafikoa agertzen daeta 6.1.3 bertsioan, berriz, CARRUSEL DE GRAFICAS-en aurkituko dugu (bertsio honetan, grafikoapantailan ikusteko, Carrusel de graficas-en Klik bitan egin behar da).

ESPLORATZEN: ADAR eta ORRIEN DIAGRAMA. KAXA-DIAGRAMA

SPSSWIN martxan jarri eta datu-fitxategia kargatu ondoren, Resumir-en barruan Frecuencias aukerahautatu beharrean, Explorar hauta nezakeen. Horretarako hauek dira pausoak: Estadísticos, Resumir,Explorar,... Aldagai bezala menpeko zerrendarako aukeratuko dut: RAVEN, eta Mostrar-en, Ambosaukera. Grafikoen karruselean dagoen kaxa-diagrama eta emaitza hauek lortuko ditut.

6.1.3 bertsiorako

SPSSWIN 6.1.3

RAVEN

Valid cases: 321,0 Missing cases: 14,0 Percent missing: 4,2

Mean 51,4891 Std Err ,2973 Min 30,0000 Skewness -,9465

Median 52,0000 Variance 28,3632 Max 60,0000 S E Skew ,1361

5% Trim 51,8242 Std Dev 5,3257 Range 30,0000 Kurtosis 1,1432

95% CI for Mean (50,9043; 52,0739) IQR 6,0000 S E Kurt ,2713

Frequency Stem & Leaf

65Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

60,0

57,5

55,0

52,5

50,0

47,5

45,0

42,5

40,0

37,5

35,0

32,5

30,0

Histograma

Fre

cuen

cia

uencia

80

60

40

20

0

Desv. típ. = 5,33

Media = 51,5

N = 321,00

RAVEN

Histograma

Page 78: Estatistika teoria eta praktika SPSSWIN erabiliz

15,00 Extremes (30), (34), (37), (39), (40)

2,00 41 . 00

3,00 42 . 000

5,00 43 . 00000

10,00 44 . 0000000000

7,00 45 . 0000000

9,00 46 . 000000000

11,00 47 . 00000000000

12,00 48 . 000000000000

18,00 49 . 000000000000000000

28,00 50 . 0000000000000000000000000000

24,00 51 . 000000000000000000000000

22,00 52 . 0000000000000000000000

29,00 53 . 00000000000000000000000000000

24,00 54 . 000000000000000000000000

23,00 55 . 00000000000000000000000

28,00 56 . 0000000000000000000000000000

19,00 57 . 0000000000000000000

10,00 58 . 0000000000

16,00 59 . 0000000000000000

6,00 60 . 000000

Stem width: 1

Each leaf: 1 case(s)

Hi-Res Chart # 1: Gráfico de cajas de raven

7.5 bertsiorako

66

321 95,8% 14 4,2% 335 100,0%RAVENN Porcentaje N Porcentaje N Porcentaje

Válidos Perdidos Total

Casos

Resumen del procesamiento de los casos

51,49 ,30

50,90

52,07

51,82

52,0028,363

5,33

3060

30

6,00

-,946 ,136

1,143 ,271

Media

Límiteinferior

Límitesuperior

Intervalo de confianzapara la media al 95%

Media recortada al 5%

Mediana

VarianzaDesv. típ.

Mínimo

MáximoRango

Amplitud intercuartil

Asimetría

Curtosis

RAVENEstadístico Error típ.

Descript ivos

Page 79: Estatistika teoria eta praktika SPSSWIN erabiliz

67Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Explorar

RAVEN Stem-and-Leaf Plot

Frequency Stem & Leaf

15,00 Extremes (=<40)

2,00 41 . 00

3,00 42 . 000

5,00 43 . 00000

10,00 44 . 0000000000

7,00 45 . 0000000

9,00 46 . 000000000

11,00 47 . 00000000000

12,00 48 . 000000000000

18,00 49 . 000000000000000000

28,00 50 . 0000000000000000000000000000

24,00 51 . 000000000000000000000000

22,00 52 . 0000000000000000000000

29,00 53 . 00000000000000000000000000000

24,00 54 . 000000000000000000000000

23,00 55 . 00000000000000000000000

28,00 56 . 0000000000000000000000000000

19,00 57 . 0000000000000000000

10,00 58 . 0000000000

16,00 59 . 0000000000000000

6,00 60 . 000000

Stem width: 1

Each leaf: 1 case(s)

Emaitzak, kasu bietan baliokideak, bi zatitan banatuak azaltzen dira. Erabiliko den kasu-kopurua goianadierazi ondoren, oinarrizko estatistikoak azaltzen dira, maiztasunak eskatu ditugunean bezalaxe.

Ezberdintasunak hiru baliotan daude:

IQR(amplitud intercuartil): KOARTILARTEKO IBILTARTEA da. Hau da, hirugarren eta lehenengokoartilarteko tartea adierazten digu. Kasu honetan, gogoratzen baldin bazara, hirugarren koartilak 55balio zuen eta lehenengoak 49; beraz, ibiltartearen balioa 6 da.

5% TRIM – Media recortada al 5%: Hau batezbesteko berezi bat da. Kalkuluak egiterakoan datuhandienen % 5 eta datu txikienen % 5 baztertzen ditu. Pentsatzekoa da banaketa bateko erdiko puntuazein den jakiteko muturreko datuek, handienek eta txikienek, batezbestekoa asko baldintzatzen dutelaeta, ondorioz, kalkuluak egiterakoan balore horiek kendu egiten ditu.

Intervalo de confianza para la media al 95%. 95% CI for Mean: Batezbestekoaren % 95ekokonfiantza-tartea. 6. gaian aztertuko dugu eta bertan aurkituko duzu tarte honen deskribapen zehatza.

Behealdean Adar eta Orrien diagrama azaltzen digu.

Gure aldagaiak hartzen dituen balio desberdinen kopurua bezalako uneak dira diagrama moduhonetan aurkeztea posible egiten dutenak. Modu hau 2.2.9. atalean aztertutako bertsioaren ondoan,zertxobait errazagoa da interpretatzeko garaian.

Lehenengo ilaran Extremes izenaren barruan 15 balio daudela adierazten digu; batezbestekotik 2desbideratze tipiko baino gehiago aldentzen diren datuak dira. Parentesi artean Extremes hauek hartzendituzten balioak zein diren azaltzen digu: 30, 34, 37, 39 eta 40.

Page 80: Estatistika teoria eta praktika SPSSWIN erabiliz

Amaitzeko, grafikoen karruselean, aztertutako RAVEN aldagaiaren kaxa-diagrama dugula azaltzendigu, ondoren aurkezten duguna, hain zuzen:

2.5. ADIBIDE OROKOR BAT

Gai honetan ikusitako kontzeptuak barneratu, eta bide batez laburtzeko, adibide orokor edo osatu batikusiko dugu. Hemen garatu ditugun estatistiko ugari kalkulatuko ditugu bertan, datuak taldekatu aurretiklortzen ditugun emaitzak, taldekatu ondoren, eta azkenik SPSSWIN paketearekin lortutako emaitzak kon-paratzearekin batera.

Imajina dezagun egoera bat, non ikastola bateko psikopedagogoak ondorengo taulan azaltzen diren50 ikasleren hitz-jarioaren frogen emaitzak aztertu nahi dituen (Kalkulu-prozesuak arintzeko, jadaordenatuak aurkezten dizkizut).

20 21 22 23 24 24 24 26 28 30 31 31 32 35 35

35 36 36 40 40 41 41 41 42 44 44 45 48 50 50

50 50 50 52 53 56 60 60 60 61 62 62 64 65 67

70 71 73 73 74

Lehenik datuak taldekatu egingo ditugu, eta gero bi kasutan (taldekatu aurretik eta taldekatu ondoren)zentralizazio- eta sakabanatze-neurriak kalkulatuko ditugu (eskuz). Kalkuluak, planteatuko diren galdereierantzunez egitea proposatzen dizut.

1.- Datuak 5eko luzera duten tartetan taldekatzea

Gure datuak jada ordenatuak ditugunez, daturik txikiena 20 eta handiena 74 dela badakigu. Kasu honetanhandiena eta txikienaren arteko heina edo diferentzia 54 da (20tik 74ra).

Gure datuak 5eko luzera duten tartetan hartu nahi baditugu, gure datuen luzera osoak 5aren multiploaizan beharko du. Horregatik kasu honetan, 5aren multiploa izan dadin, hein osoa unitate batean luzatubeharko dugu; 54tik 55era. Horretarako, handitu behar dudan unitate hori, erdia goitik eta erdia behetikluzatuko dut. Hau da, lan egiteko erabilitako muga errealak 19.5 eta 74.5 izango dira.

Lehen eta azken tarteen muga errealak erabaki ondoren, tarte guztiak definituta geratuko dira, 5ekoneurrikoak izan behar baitute. Mugak hauek izango dira: 19.5–24.5; 24.5–29.5;.....; 64.5–69.5;69.5–74.5.

68

321N=

RAVEN

70

60

50

40

30

20

212722321952242841023627127644

26013954

226

Page 81: Estatistika teoria eta praktika SPSSWIN erabiliz

69Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Maiztasunen banaketa osatzeko tarte bakoitzeko elementu-kopurua zenbatzea aski izango dut.Ondoko maiztasun-taulan, benetako mugak eta itxurazko mugak zutabeez gain, tarte-ordezkariak (tartebakoitzeko erdiko puntua), eta bi eratako maiztasunak (arruntak eta metatuak) agertzen dira.

Benetako Itxurazko Xi: Tarte- ni na

mugak mugak -ordezkaria

19.5 – 24.5 20 – 24 22 7 7

24.5 – 29.5 25 – 29 27 2 9

29.5 – 34.5 30 – 34 32 4 13

34.5 – 39.5 35 – 39 37 5 18

39.5 – 44.5 40 – 44 42 8 26

44.5 – 49.5 45 – 49 47 2 28

49.5 – 54.5 50 – 54 52 7 35

54.5 – 59.5 55 – 59 57 1 36

59.5 – 64.5 60 – 64 62 7 43

64.5 – 69.5 65 – 69 67 2 45

69.5 – 74.5 70 – 74 72 5 50

2.- Zein da lortutako puntuaketen heina edo luzera? Eta datuak tartetan taldekatu ondorengobanaketarenak?

Hasierako banaketaren luzera 54 da (74 - 20), atal teorikoan azaltzen zen bezala, eta luzera honi unitatebat gehitzen bazaio 55 izango da.

Behin datuak tartetan taldekatu ondoren, luzera osoa berdina da, hau da, tarte handienaren goikomugari tarte txikienaren beheko muga kenduta 55 da (74,5 - 19,5).

3.- Erdialdeko joera duten neurrien indizeak kalkula itzazu taldekatu aurretik eta ondoren. Zein dirazehatzagoak? Erdialdeko joera duen zein neurri iruditzen zaizu egokiagoa?

Tartetan taldekatu aurretik, joera zentraleko indizeak (zentralizazio-neurriak) kalkulatzeko hasierakodatuetan fijatzen gara.

Modaren kalkulutik hasiko gara, hau da, gehien errepikatzen den baliotik. 50 da 5 bider azaltzendena.

Mediana, balioen % 50 bere ezkerrera eta beste % 50 bere eskuinera utziko duen balioa da. Hau da,balioak txikitik handira ordenatu ondoren erdian geratzen dena. Gure kasuan, 50 datu ditugula kontuanizanik, erdiko balioak 25. eta 26. ordena betetzen dutenak dira; 25. ordenako balioa 44a da, eta 26.ordenakoa ere 44 da. Beraz, medianak 44 balio du (balio hauek desberdinak balira, bien artekobatezbestekoa hartuko genuke medianaren balio bezala).

Batezbestekoaren kalkulurako, balio guztiak batu eta zati 50 egin beharko da. Kasu honetan baturak(zuk egin ordez nik egin dut) 2.272 balio du eta batezbestekoa hau izango da:

Estatistiko berberen kalkulurako, datuak taldekatu ondoren, taula hau osatuko dugu:

X = Xn

= 45.44i∑

Page 82: Estatistika teoria eta praktika SPSSWIN erabiliz

Benetako Itxurazko Xi: Tarte- ni ni * xi

mugak mugak -ordezkaria

19.5 – 24.5 20 – 24 22 7 154

24.5 – 29.5 25 – 29 27 2 54

29.5 – 34.5 30 – 34 32 4 128

34.5 – 39.5 35 – 39 37 5 185

39.5 – 44.5 40 – 44 42 8 336

44.5 – 49.5 45 – 49 47 2 94

49.5 – 54.5 50 – 54 52 7 364

54.5 – 59.5 55 – 59 57 1 57

59.5 – 64.5 60 – 64 62 7 434

64.5 – 69.5 65 – 69 67 2 134

69.5 – 74.5 70 – 74 72 5 360

50 Σ = 2300

Behin taula osatu ondoren, tarte modala 40 - 44 dela badakigu. Modarentzako balio zehatzen batekinlan egin behar badugu, moda bezala, tarte modalaren klase-marka edo tarte ordezkariahartuko dugu.Gure kasuan 42.

Batezbestekoa nahiz mediana kalkulatzeko, dagozkien formulez baliatu beharko dugu.

Batezbestekoarentzat:

Medianaren kalkulurako, 50 datu ditugula kontuan izanik, jakin behar dugu, lehenik, zein tartetanaurkitzen den. 25. eta 26. ordeneko balioak zein tartetan aurkitzen dira? 40 - 44 bitartean.

Behin tartea ezagutu ondoren, formula aplika dezakegu:

Gure kasuan honako balioak hartzen ditu:

Formula hau aplikatzerakoan, tarte erreala 39.5 - 44.5 dela gogoan izan behar dugu, eta ez 40 - 44a.Honek baldintzatuko du tartearen luzera erreala 5 unitatekoa izatean, eta berorren beheko muga, egiaz39.5 izatean.

Zein indize dira zehatzagoak eta egokiagoak?

Taldekatu gabeko datuekin kalkulaturiko neurri edo indize estatistikoak zehatzagoak direla begi--bistakoa da, kasu hauetan datu errealekin lan egiten baita, eta, aldiz, taldekatutako puntuazioetan tartebakoitzeko erdiko puntuekin lan egiten da, azken hauek, multzoaren ordezkari baino ez direlarik.

Md = 39.5+

50

218

8* 5 = 39.5 +

7

8* 5 = 39.5 + 4.375 = 43.875

Md = L +

N

2N

n* Ii

i -1

ii

X =ni* X

ni=

2300

50= 46i∑

70

Page 83: Estatistika teoria eta praktika SPSSWIN erabiliz

Puntuazio taldekatuen erabilera, beharrezko indizeak lortzeko erraztasun handiagoak bakarrik justifi-katzen du, inoiz ez emaitzen zehaztasunak. Desberdintasun txikiak daudela ikusten dugu bi batezbestekoeta bi medianen artean. Modak ez du zerikusirik bi kasuetan.

Erdialdeko joera duen neurririk egokiena, normalki batezbestekoa da. Aldiz, banaketa oso asimetrikoadenean, mediana hobea da. Aurrerago asimetria-indize bat kalkulatuko dugu, eta emaitzaren arabera zeinden erabakiko dugu. Bitartean batezbestekoarekin lan egingo dugu. Modak puntuazioen aldakortasunenaurrean sentikortasun gutxiena azaltzen duenez, gutxien erabiltzen dena bera da.

4.- Kalkula itzazu dispertsio-neurriak, datuak taldekatu aurretik eta ondoren

Gehien erabiltzen direnak, oro har, jadanik kalkulatuak ditugun luzera eta heina, bariantza eta, batez ere,desbideratze tipikoa dira, koartilarteko ibiltarterdiarekin.

Bariantzarekin hasiko gara.

Kalkuluotarako, taldekatu gabeko datuekin lan egiten dugun kasuan, prozesua batezbestekoarenkalkuluarekin (45.44) hasten da, eta balio bakoitzaren arteko diferentzia kalkulatu ondoren diferentzia haukarratura jasotzen da eta, azkenik, karratura igotako diferentzia hauen guztien batezbestekoa kalkulatu.

Bariantzaren formula eta emaitza hauek dira:

Eta hemendik desbideratze tipikoa:

Batezbestekoaren kasuan bezala, taldekatutako datuen kalkuluak egiteko, lehenik ondorengo taulaosatuko dugu:

Itxurazko Xi: Tarte- ni Xi – X= (Xi – X)2 ni * (Xi – X)2

mugak -ordezkaria Xi – 46

20 – 24 22 7 –24 576 4032

25 – 29 27 2 –19 361 722

30 – 34 32 4 –14 196 784

35 – 39 37 5 –9 81 405

40 – 44 42 8 –4 16 128

45 – 49 47 2 1 1 2

50 – 54 52 7 6 36 252

55 – 59 57 1 11 121 121

60 – 64 62 7 16 256 1792

65 – 69 67 2 21 441 882

70 – 74 72 5 26 676 3380

12500

Eta hemendik bariantza:

x2 i i

2

i

S = n *( X - X )

n=

12500

50= 250

x x2S = bariantza = S = 247.32 = 15.72

x2 i

2

S =( X - X )

n=

12366.32

50= 247.32∑

71Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 84: Estatistika teoria eta praktika SPSSWIN erabiliz

Bariantzaren kalkuluak ere emaitza zertxobait aldatzen duela ikusten da. Ondorioz, baita desbideratzetipikoak ere (Sx). Gogoratu, azken hauek bariantzaren erro karratutik ateratzen ditugula.

Gure kasuan, taldekatu gabeko datuentzat Sx = 15.72 da; eta taldekatutako datuentzat, Sx = 15.81

Bi kasuetan aldagarritasun-koefizienteek hauxe balio dute:

Taldekatu gabeko datuentzat:

Taldekatutako datuentzat:

Diferentziak oso handiak ez direla ikusten da, eta taldekatutako datuen kalkuluaren erosotasun etaerraztasuna oso handia dela. Edozein kasutan, orain arte ohizkoa zen eztabaida eta konparaketa honek,gaur egun, ordenadoreekin, zentzua galtzen du emaitzen gehiengoa informatikaren laguntzaz lortukobaitugu.

Aurrerago koartilarteko ibiltarterdiak kalkulatuko ditugu.

5.- Kalkula ezazu 90. pertzentila

Gogora dezagun, 90. pertzentila bere azpitik subjektuen % 90 uzten duen puntua dela. Hau da, gureadibidean 45 subjektu.

Taldekatu gabeko datuentzat, pertzentil hau, 45. ordenako eta 46. ordenako subjektuen balioen arteanegongo da. Bere balioak 67 eta 70 dira, hurrenez hurren. Ez gara konplikatuko, gure pertzentila erdikobalioa izango baita: 68.5.

Taldekatutako datuentzat, gure balioa azken tartearen mugan egongo dela badakigu. 45. eta 46.ordenetako balioen arteko diferentzia markatzen duen puntua da. Edozein kasutan, xehetasun horretazkonturatu ez bagara ere, ohizko formula erabiliz pertzentilaren kalkulura jo beharko da. Horretarako, zeintartetan kokatzen den jakin beharko dugu. Berdin izango da 65 – 69 edo 70 – 74 tartean kokatzen delapentsatzea. Froga egin dezakezu eta emaitzak berdina izan behar du. Nik, 65 – 69an dagoela pentsatukodut, eta hortik aurrera, formularen erabilpena egingo dut.

Logikoki, tartearen luzera 5 da, eta tartearen beheko muga 64.5 da.

6.- Kalkula itzazu mediana, moda eta batezbestekoari dagozkien puntuazio diferentzialak (diferen-tziatan) eta puntuazio tipikoak

Gogora dezagun puntuazio diferentzialak puntuazio zuzen bakoitzari batezbestekoa kenduz lortzendirela.

Taldekatu gabeko puntuazioentzat modak 50, medianak 44 eta batezbestekoak 45.44 balio dutelakontuan izanik, puntuazio diferentzialak hauek izango dira:

Pk = L +

N * k

100N

n* I = 64.5+

50* 90

10043

2* 5 = 69.5i

i -1

ii

− −

Ak =Sx

X* 100 =

15.81

46*100 = 34.36

Ak =Sx

X* 100 =

15.72

45.44*100 = 34.59

72

Page 85: Estatistika teoria eta praktika SPSSWIN erabiliz

Moda, diferentziatan: 50 – 45.44 = 4.56Mediana, diferentziatan: 44 – 45.44 = –1.44Batezbestekoa, diferentziatan: 45.44 – 45.44 = 0

Taldekatutako puntuazioentzat modak 42, medianak 43.875 eta batezbestekoak 46 balio dute.Hemendik puntuazio diferentzialak:

Moda, diferentziatan: 42 – 46 = 4Mediana, diferentziatan: 43.875 – 46 = –2.125Batezbestekoa, diferentziatan: 46 – 46 = 0

Jakin beharrekoa da puntuazio diferentzialen batezbestekoak 0 balioa izango duela beti.

Puntuazio tipikoak puntuazio zuzenei batezbestekoa kendu eta zati desbideratze tipikoa eginezlortuko ditugu, edo berdin dena, puntuazio diferentzialak zati desbideratze tipikoa.

Gure kasuan, taldekatu gabeko puntuazioentzat (X= 45.44 eta Sx= 15.72):

Moda, tipikotan: (50–45.44)/15.72 = 4.56/15.72 = 0.29Mediana, tipikotan: (44–45.44)/15.72 = –1.44/15.72 = –0.0947Batezbestekoa, tipikotan: (45.44–45.44)/15.72 = 0 = 0

Taldekatutakoentzat (X= 46 eta Sx= 15.81):

Moda, tipikotan: (42–46)/15.81 = 4/15.81 = 0.25Mediana, tipikotan: (43.857–46)/15.81 = (–2.125)/15.81 = – 0.13Batezbestekoa, tipikotan: (46–46)/15.81 = 0

7.- Zer portzentaia uzten du bere azpitik 50 puntu lortu zituen ikasle batek? Eta, datuak taldekatu gabeegingo balitz?

Taldekatu gabeko datuentzat garbi dago 50 baino txikiago diren 28 puntuazio daudela, puntuazioen % 56direlarik. Hau da, 56. pertzentilari dagokio.

Taldekatutako datuentzat, pertzentilen formula erabiliko da, eta aplikatzeko, lehenik kontuan edukibehar duguna hau da: 50 balioa 49.5-54.5 tartean dago.

Orain, k ordenako pertzentila kalkulatzeko erabiltzen dugun formula daukagu:

Normalki, pertzentilaren k heina edo ordena zein den jakiten da eta puntua (balioa) kalkulatu nahiizaten da. Kasu honetan alderantziz da, puntua (balioa) ezagutzen da eta pertzentilaren ordena edo heinajakin nahi da.

Formulan gure datuak ordezkatzen ditugu, eta k-ren balioa askatu beharko dugu.

Eta hemendik bakanduz, k balioa lortuko dugu: k = 57,4. Bertatik, 50 balioa 57,4 pertzentilaridagokiola lortzen dugu. Hau da subjektuen % 57,4k 50 punturen azpiko puntuazioak lortzen ditu.

50 = 49.5 +

50 * k

10028

7* 5

Pk = L +

N * k

100N

n* I =i

i -1

ii

73Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 86: Estatistika teoria eta praktika SPSSWIN erabiliz

8.- Kalkula ezazu koartilarteko ibiltarterdia

Gogora dezagun koartilarteko ibiltarterdia 3. ordenako eta 1. ordenako koartilen diferentziaren erdiakalkulatuz lortzen dugula. Eta Q3 = P75, eta Q1 = P75.

Datuak taldekatu gabe egiten badugu, P25 = 31.5 eta P75 = 60 dira.

Datu taldekatuta, formula hau erabil dezakezu eta kalkuluak egin; nire kalkuluek emaitza hauek emandituzte:

Q1 = 33.875Q3 = 60.57

Eta hemendik Q koartilarteko ibiltarterdia taldekatu gabeko datuentzat:

Eta taldekatutako datuentzat:

Desberdintasun txikiak badaudela ere ikusten da. Gogora dezagun, beti ere zehatzagoak, egokiagoakedo errealitateari atxikiagoak direla taldekatu gabeko datuen emaitzak.

9.- Zer puntuazio diferentzial eta tipikoa dagokio frogan 60 puntu lortu zituen ikasle bati?

Lehen azaldu dugu puntuazio diferentziala, puntuazio zuzenari puntuazioen batezbestekoa kenduzlortuko dugula. Puntuazio tipikoa, berriz, puntuazio diferentziala zati desbideratze tipikoa eginez.

Gure kasuan, puntuazioak taldekatu gabe lan egiten badugu, batezbestekoak 45.44 balio du etadesbideratze tipikoak, 15.72.

60ri dagokion puntuazio diferentziala: 60–45.44 = 14.5660ri dagokion puntuazio tipikoa: 14.56/15.72 = 0.92

10.- Kalkula itzatzu emaitza hauek guztiak, hala nola histograma, SPSSWIN erabiliaz

Liburu honetan, darabilzkigun bi bertsioetan SPSSWIN paketeak emaitza hauek guztiak nola aurkeztendizkigun ikusiko da. Horretarako, lehenik datuak sartu behar ditugu liburuaren azken atalean ematendiren pausoak jarraituz. Nik, OROKORRA aldagaia definitu dudan fitxategi bat sortu dut, eta datu guztiaksartu ditut bertan.

Ondoren, indize estatistiko guztiak eta aldagaiaren histograma kurba normalarekin batera kurtosia etaasimetria “ikusi” ahal izateko, emandako pausoak hauek dira:

EstadísticosResumir

Frecuencias...

Eta OROKORRA aldagaia Variable(s)-en erdiko blokera pasatzen dut. Estatistikoen botoia sakatu etaTendencia central, Todos, Distribucion blokeko todos, eta Dispersion blokeko todos aktibatzen ditut etaValores de percentiles bloketik, Cuartiles, Continuar.

Q=Q3- Q1

2=

60.57 -33.875

2=

26.695

2= 13.3475

Q=Q3- Q1

2=

60 - 31.5

2=

28.5

2= 14.25

74

Page 87: Estatistika teoria eta praktika SPSSWIN erabiliz

Segidan Graficas botoia aktibatzen dut, eta grafikoen motan Histograma, eta Con curva normalhautatzen dut. Continuar.

Formatoko aukerak eraldatu gabe uzten ditut.

Aceptar.

SPSSWINeko bi bertsioekin lortu diren emaitzak, logikoki berdinak dira, eta guk hemen 6.1.3 bertsiokoakbesterik ez ditugu aurkeztuko.

Modu berean, gure datuen histograma, kurba normalaren gainjartzearekin batera aurkezten dugu.

SPSSWIN 6.1.3

OROKORRA

Valid Cum

Value Label Value Frequency Percent Percent Percent

20,00 1 2,0 2,0 2,0

21,00 1 2,0 2,0 4,0

22,00 1 2,0 2,0 6,0

23,00 1 2,0 2,0 8,0

24,00 3 6,0 6,0 14,0

26,00 1 2,0 2,0 16,0

28,00 1 2,0 2,0 18,0

30,00 1 2,0 2,0 20,0

31,00 2 4,0 4,0 24,0

32,00 1 2,0 2,0 26,0

35,00 3 6,0 6,0 32,0

36,00 2 4,0 4,0 36,0

40,00 2 4,0 4,0 40,0

41,00 3 6,0 6,0 46,0

42,00 1 2,0 2,0 48,0

44,00 2 4,0 4,0 52,0

45,00 1 2,0 2,0 54,0

48,00 1 2,0 2,0 56,0

50,00 5 10,0 10,0 66,0

52,00 1 2,0 2,0 68,0

53,00 1 2,0 2,0 70,0

56,00 1 2,0 2,0 72,0

60,00 3 6,0 6,0 78,0

61,00 1 2,0 2,0 80,0

62,00 2 4,0 4,0 84,0

64,00 1 2,0 2,0 86,0

65,00 1 2,0 2,0 88,0

67,00 1 2,0 2,0 90,0

70,00 1 2,0 2,0 92,0

71,00 1 2,0 2,0 94,0

73,00 2 4,0 4,0 98,0

74,00 1 2,0 2,0 100,0

———- ———- ———-

Total 50 100,0 100,0

75Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 88: Estatistika teoria eta praktika SPSSWIN erabiliz

Hi-Res Chart # 1: Histograma de OROKORRA

Mean 45,440 Std err 2,247 Median 44,000

Mode 50,000 Std dev 15,886 Variance 252,374

Kurtosis –1,061 S E Kurt ,662 Skewness ,158

S E Skew ,337 Range 54,000 Minimum 20,000

Maximum 74,000 um 2272,000

Percentile Value Percentile Value Percentile Value

25,00 31,750 50,00 44,000 75,00 60,000

Valid cases 50 Missing cases 0

Gure emaitzen histograma honakoa da. Ia simetrikoa dela ondoriozta genezake. Begiratu grafikoa etaasimetria koefizientearen emaitza (Skewness = 0.158).

Eta kurba normala baino zapalagoa da, kurtosi koefizientea negatiboa da (Kurtosia = -1.061).

Irakurleak, eskuz lortu ditugun emaitzak konpara ditzake, nola taldekatu gabeko datuen kasuan, halataldekatuetakoan edo SPSSWINekoetan.

Zuk diferentziak balora ditzazun, konparaketa-taula hau eraiki dizut.

76

50 0 45,4400 44,0000 50,00 15,8863 252,3739 20,00 2272,00 31,7500 44,0000 60,0000OROKORRAVálidos Perdidos

N

Media Mediana Moda Desv. típ. Varianza Mínimo Suma 25 50 75

Percentiles

Estadísticos

Desv. típ. = 15,89

Media = 45,4

N = 50,00

OROKORRA

75,0

70,0

65,0

60,0

55,0

50,0

45,0

40,0

35,030,0

25,0

20,0Frec

uenc

ia

8

6

4

2

0

SPSSWIN 7.5

Page 89: Estatistika teoria eta praktika SPSSWIN erabiliz

Indize Datu isolatuak. Datuak SPSSWINeko

estatistikoa Taldekatu gabe Taldekatuta emaitzak

Batezbestekoa 45.44 46 45.44

Moda 50 42 50

Mediana: P50 44 43.875 44

Desbideratze tipikoa 15.72 15.81 15.886

Bariantza 247.326 250 252.374

P25 31.5 33.875 31.75

P75 60 60.57 60

Koartilarteko Ibilt. 14.25 13.3975 14.125

Txikiena 20 19.5 20

Handiena 74 74.5 74

Batura 2272 2300 2272

Emaitzak kalkulatzeko era desberdinen artean diferentziak badaudela ikusten da hauek txikiak badiraere. Batik bat, taldekatutako datuen eta beste bi kasuen artean daude diferentziak. Bariantzaren emai-tzetan dagoen diferentzia nabarmentzea interesatzen zait, batez ere taldekatu gabeko eta SPSSWINekoenartekoa. Hori, SPSSWINek bariantzaren emaitza aurkeztu beharrean KUASIBARIANTZARENA aurkeztenduelako da. Hau, biztanleria-bariantza estimatzaile bezala, propietate hobeak dituen estatistiko bat da etahorregatik, SPSSWINek aurkezten duen balioa da.

Eskuz eginiko kalkuluaren eta SPSSrekin egindakoaren baliokidetasuna honakoa da: bariantzarenkasuan zati subjektu-kopurua egin beharrean, kuasibariantzarentzat zati subjeku-kopurua ken bat egitenda. Beraz, gure bariantzaren emaitzak bider subjektu-kopurua (50) egiten baduzu, SPSSWINen emaitzabider subjektu-kopurua ken bat (49) eginda bezalako emaitza lortuko duzu.

Gainerantzeko balioak berdinak dira P25aren kasuan ezik. Diferentzia txiki bat dago eta hori,SPSSWINek zuzenketatxo bat egiten duelako da, azken emaitza azaletik eraldatuz.

Eta horrela amai genezake adieraziz, berriro ere, gure emaitzetan zehaztasunik handiena, taldekatugabeko datuekin lortuko dugula. Programa-paketeek, orokorki, eta SPSSWINek zehazki, era honetanegiten dituzte beren kalkuluak, taldekatu gabe.

77Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 90: Estatistika teoria eta praktika SPSSWIN erabiliz

2.6. ARIKETAK: ESTATISTIKA DESKRIBATZAILEA

1.- Irakasle batek, A eta B ikastaldeetako matematikako ezagupen-maila jakin nahi du. Horretarako,ikastalde bakoitzari froga bat egiteko, 15 ikasle aukeratu ditu. Lortutako emaitzak hauek izan dira:

A taldea: 4 3 7 5 6 4 5 4 5 6 7 7 3 4 5B taldea: 8 9 1 2 8 8 4 3 2 2 10 7 8 2 1

a) Zein da talde bakoitzeko ezagupen-maila?

b) Zein da B taldeko mediana?

c) Zein da A taldeko moda?

d) Zein da talde bakoitzeko sakabanatze-maila?

2.- Ondoko tauletan agertzen diren maiztasun-banaketen desbideraketa tipikoa, koartilarteko ibiltar-terdia, eta batezbesteko eta medianaren artean gelditzen diren elementuen portzentaia kalkulatu.

A) Xi mi B) Xi Mi

5 3 2 4

7 5 3 6

8 8 4 10

9 6 5 11

10 12 6 13

12 8 7 18

13 7 8 20

16 1

D) Xi mi E) Xi Mi

4 – 6 3 3 – 5 5

7 – 10 5 6 – 9 12

11 –16 8 10 – 15 20

17 – 22 6 16 – 25 29

23 – 30 12 26 – 40 40

30 – 50 8

50 –100 8

3.- Talde bateko 46 ikaslek froga batean lortu dituzten emaitzak hauek izan dira:

84 80 90 82 84 70 89 77 62 79 73 74 87 76 79 97 69 78 95 85 78 86 92 85 54 65 56 71 65 7058 52 78 85 94 66 57 63 71 71 84 74 62 90 81 77

a) Kalkula itzazu emaitzen batezbestekoa, desbideratze estandarra edo tipikoa eta mediana.

b) Eraiki itzazu 5 luzerako tarteak eta, hauetan oinarrituz, datu hauen maiztasun-taula.

c) Aurreko puntuan eraiki duzun maiztasun-taula kontuan hartuta, eta tarte-ordezkariak erabakiondoren, kalkula itzazu batezbestekoa, desbideratze tipikoa eta mediana. Konpara itzazu atalhonetan lortu dituzun emaitzak a) atalean lortutakoekin.

d) Egin ezazu adierazpen grafiko bat.

78

Page 91: Estatistika teoria eta praktika SPSSWIN erabiliz

79Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

4.- 150 ikaslek adimena neurtzen duen test batean lortu dituzten emaitzak hauek dira:

Xi ni

0 – 9 7

10 – 19 8

20 – 29 13

30 – 39 12

40 – 49 31

50 – 59 33

60 – 69 24

70 – 79 10

80 – 89 9

90 – 99 3

a) Kalkula itzazu komenigarrienak diren zentralizazio- eta sakabanatze-neurriak.

b) Zenbat ikaslek lortzen dute 71 puntu baino gutxiago?

c) Kalkula itzazu P65, koartilarteko ibiltartea eta D4 balioak.

d) Zein da Xi = 82ri dagokion pertzentila?

e) Lau ikasleren puntuazioak hauek izan dira:a: P55b: Xi: 55d: Puntuazio tipikoa: Zi = 0,33e: D6Sailkatu ikasle hauek, beren puntuazioak begiratuz, handienetik txikienera.

5.- Ikastetxeko 150 ikasleen batezbestekoa 60 eta bariantza 20 baldin badira:

a) Ikasle bakoitzaren puntuazioari 10 puntu gehitu badiegu, zein izango da puntuazio berrienbatezbesteko eta bariantza.

b) Ikasle bakoitzaren puntuazioa bikoizten badugu, zein izango da puntuazio berrien batezbes-tekoa, bariantza eta desbideratze estandarra?

6.- Batezbestekoa 20 eta desbideratze tipikoa 5 duen talde handiago batetik atera ditugun datu hauekditugu:

6, 12, 15, 20, 28

Eralda itzazu puntuazio hauek, lehenengo puntuazio tipikotan, eta gero batezbestekoa 50 etadesbideratze tipikoa 10 duten puntuazio-talde batera.

7.- Ondoren maisuen lagin ezberdinek, azken seiurtekoan, trebakuntza-kurtsoetan sartu zituzten ordu--kopuruei dagozkien datuak ditugu.

n -X Sx

Haurtzaindegikoak 50 100 10

Ertainetan 40 120 20

Kalkula ezazu:

a) Zein da, orokorrean, irakasleen ordu-kopuruen batezbestekoa?

b) Irakasle-taldeetatik, zein har dezakegu homogeneoena bezala aldagai honetan?

c) Azken seiurtekoan eginiko trebakuntza-orduei dagokienez, zein da irakasleen sakabanatze osoa?

Page 92: Estatistika teoria eta praktika SPSSWIN erabiliz

8.- Bere batezbestekoa 40 eta desbideratze tipikoa 6 dituen aldagai batean lau ikaslek lortutakopuntuazioak ezagunak dira. Baina puntuazio bakoitza eskala desberdinetan emana datorkigu.

Puntuazio guztiak eskala guztietan jarri eta konpara itzazu.

Ikaslea Puntuazioa

A Puntuazio zuzena: 45

B Puntuazio diferentziala: 6

D Puntuazio tipikoa: 1

E Eneatipoa: 6

9.- Demagun 72 ikaslek aldagai batean lortu dituzten emaitzak ondoan agertzen direnak izan direla.

15, 28, 36, 34, 19, 30, 40, 33, 26, 29, 35, 27, 20, 24, 31, 23, 17, 25, 33, 26, 14, 26, 34, 25, 16,22, 30, 20, 13, 20, 24, 9, 21, 26, 25, 19, 17, 19, 29, 23, 18, 20, 24, 28, 14, 16, 23, 33, 9, 17, 12,37, 8, 21, 28, 36, 11, 15, 30, 38, 26, 16, 32, 41, 24, 23, 31, 27, 32, 38, 27, 24.

Kalkula itzazu aldagaiaren desbideratze tipikoa eta koartilarteko ibiltarterdia. Kalkulatu 18 puntuedo gehiago lortu dutenen portzentaia.

Elkartu puntuazio hauek 4 luzerako tarte batzuetan.

Elkartu ondoren kalkula itzazu ondoko indizeak: desbideratze tipikoa, koartilarteko ibiltarterdia, D2,P3, P85. Kalkulatu 18 puntu edo gehiago lortu dutenen portzentaia.

Banaketa honen adierazpen grafikoren bat marraztu.

10.- 3X – 5 aldagaiaren batezbestekoa eta desbideratze tipikoa 25 eta 15 baldin badira, kalkula itzazuX2 aldagaiaren batezbestekoa eta desbideratze tipikoa, azken aldagai honen aldakuntza-koefizien-tea 80 dela kontuan harturik.

Emaitzak: 125, 100

11.- – 4, 2, *, 4, 0 puntuazioen bariantza 16 eta aldakuntza-koefizientea 200 dira. Kalkula ezazuezezaguna den puntuazioa.

Emaitza: 8

12.- Ematen diren datuak erabiliz egiazta ezazu ondoko berdintasuna:

Σ (Xi – –X)2 = Σ (Xi – K)2 – n (

–X – K)2

Datuak Xi: 1, 2, 3, 4, 5 K = 4

13.- Simetrikoa den maiztasun-banaketari buruz ondoko indizeak ezagutzen ditugu: 25. pertzentila = 7,Σmi = 12, Σmi*Xi = 114, eta Σmi * X2i = 1260. Kalkula ezazu 75. pertzentila, aldakuntza-koefi-zientea eta mediana eta batezbestekoaren artean gelditzen diren elementuen portzentaia.

P75=12, AK= 40.42, 0,

14.- Ikasle batzuei neurketa-tresna berri bat pasatu ondoren emaitza hauek lortu ditugu: 21, 11, 1, 16 eta31. Lortutako emaitza hauek beste neurketa-tresna batekin lortutako puntuazioekin konparatu nahiditugu. Neurketa-tresna zaharraren ezaugarriak 100 eta 20 dira (batez. eta d.t.). Neurketa-tresnaberria erabiliz lortu ditugun emaitzak, eta zaharrarekin lortutakoak ezaugarri berdinekoak izateakomeni bada, zein izango litzateke puntuazio berriekin egin behar den eraldakuntza? Eraldakuntzahau egin ondoren zeintzuk izango dira puntuazio berriak?

Emaitzak: 110, 90, 70, 100, 130

80

Page 93: Estatistika teoria eta praktika SPSSWIN erabiliz

15.- X aldagai baten batezbestekoa eta desbideratze tipikoa 10 eta 4 baldin badira, ondoko eraldakun-tzak egin ondoren lortu ditugun aldagaien batezbestekoa eta desbideratzea kalkulatu.

2X + 37, 4X, X+7, (X – 5)2.

16.- 60 ikaslek lortutako puntuazioak kontuan harturik, ondoko histograma eraiki dugu:

Kalkula itzazu: maiztasun-taula, gehien erabiltzen diren indize estatistikoak, koartilarteko ibiltarter-dia eta 16 puntu baino gutxiago lortu dutenen portzentaia.

17.- X test batean sei pertsonak lortu dituzten puntuazioak hauek dira: 4, 0, 2, 3, -6, 3.

Kalkula itzazu:

a) Batezbesteko aritmetikoa.

b) Bariantza.

c) Puntuazio txikienari dagokion puntuazio tipikoa.Emaitzak: 1, 3.37, -2.08

18.- Esku-trebetasuna neurtzen duen tresna psikometriko bat unibertsitateko ikasle-talde bati pasatuondoren, ondoko emaitza hauek lortu ditugu:

70 69 58 51 60 59 69 30 54 54 53 55 40 49 40 63 71 69 39 64 61 58 52 56 54 54 64 52 50 47 57 34

a) Elkartu puntuazio hauek 3 luzerako tarteetan.

b) Egiaztatu puntuazioen banaketa simetrikoa den ala ez.

c) Banaketa honen adierazpen grafikoren bat marraztu.

19.- Ondoko maiztasun-banaketan oinarrituz, ondoren agertzen diren galderei erantzun:

Xi mi

13 – 15 1

10 – 12 10

7 – 9 3

4 – 6 5

1 – 3 1

a) Modari dagokion puntuazio tipikoa kalkulatu.

b) Koartilarteko ibiltarteerdia kalkulatu.

c) Zein da X = 7 puntuazio zuzenari dagokion puntuazio tipikoa?

d) Eta batezbestekoari dagokion puntuazio tipikoa?

e) Aztertu banaketaren simetria.

81Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 94: Estatistika teoria eta praktika SPSSWIN erabiliz

20.- X1, X2, X3,...., Xn baloreen batezbestekoa eta desbideratze tipikoa 4 eta 5 badira, eta puntuaziohauetan oinarrituz X12, X22, X32,...., Xn2, puntuazioak lortzen baditugu kalkula itzazu puntuazioberrien batezbestekoa eta desbideratze tipikoa, beraien aldakuntza-koefizientea 50 dela ezagutuz.

Emaitzak: 41, 20.5

21.- 3, –2, 2,**, 2, 8 eta 10, puntuazioen batezbestekoa 7 bada eta aldakuntza-koefizientea 40 baldinbada, kalkula itzazu ezezaguna den ** balorea eta aldagaien desbideratze tipikoa.

Emaitzak: 26, 2.8

22.- Ondoko puntuazioak ikusi ondoren:

8, 3, 5, 4, 7, 7, 4, 8, 5, 5, 5, 10, 10 3, 6, 9

a) Elkartu puntuazio hauek 3 luzerako tarteetan.

b) Elkartu aurretik eta ondoren kalkulatu puntuazioen batezbestekoa eta desbideratze tipikoa etalortutako emaitzak konparatu.

23.- X eta Y aldagaien puntuazioak ikusi ondoren

X: 1, 7, 14, 20, 12, 12, 19, 3, 9Y: 9, 1, 4, 0, 18, 15, 17, 13, 12

Aldagaien zentralizazio- eta sakabanatze-neurriak konparatzeko komeni diren indizeak kalkulatu.

Emaitzak: AKx = 57.03, AKy = 64.74

24.- Ondoko maiztasun-taulan ematen diren baloreen mediana eta bariantza kalkulatu.

Xi ni

14–16 11

17–19 15

20–22 10

23–25 8

Kalkula ezazu 18 puntu baino gehiago lortzen dutenen portzentaia. Kalkulatu banaketa honenkoartilarteko ibiltarterdia.

Emaitzak: 18.7, 9.84, 42.04, 2.55

25.- EPI test psikometrikoa egin ondoren, 40 pertsonak ondoko puntuazio hauek lortu dituzte.

Xi ni

16 – 19 4

12 – 15 5

8 – 11 10

4 – 7 15

0 – 3 6

Datu hauetan oinarrituz, beste ikerketa bat egitea erabaki da. Bigarren ikerketa honetan lehenengoaldagaian P80 puntuaziotik gora edo P20tik bera dauden pertsonak parte hartuko dute.

82

Page 95: Estatistika teoria eta praktika SPSSWIN erabiliz

a) Bigarren ikerketan zenbat pertsonak parte hartuko dute?

b) Ikerketan parte hartzeko, zeintzuk izango dira ezarri beharko ditugun mugak, puntuazio zuzene-tan eta puntuazio tipikoetan?

Emaitzak: 16, 4.03, 12.3, –0.86, 0.89

26.- Ikastola bateko pedagogoak 60 ikasleko gela baten IK neurtzen duen tresna psikometriko bat pasatudu, eta lortutako emaitzak ondoko hauek izan dira:

Ik ni:ikasle-

-kopurua

120 – 140 7

100 – 120 17

80 – 100 26

60 – 80 10

a) Zein da taldeko IK aldagaiaren batezbestekoa?

b) Gure pedagogoak hiru talde ezberdin egitea erabaki du. Lehenengo taldea, 20 pertsonaz osatua,puntuazio handienak dauzkatenekin eratuko du. Bigarrena, baita ere 20 pertsonaz osatua, bainapuntuazio txikienak lortu dituztenekin eratua, eta hirugarrena erdipurdiko puntuazioak lortudituztenekin eratu du. Non jarri beharko ditu puntuazioen mugak lehen aipatutako baldintzakbetetzeko?

c) Zenbatek dituzte beren IK-ren puntuazioak 85 eta 120 punturen artean?

Emaitzak: 97, 88.19, 105.20, 36.73

83Aldagai baten estatistika deskribatzailea. Datuen antolaketa eta aurkezpena

Page 96: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 97: Estatistika teoria eta praktika SPSSWIN erabiliz

3. ESTATISTIKA DESKRIBATZAILEA. 2 ALDAGAI EDO GEHIAGO

3.1. SARRERA

3.2. ALDAGAIEN ARTEKO ERLAZIOAREN KOANTIFIKAZIOA

3.3. PEARSONEN KORRELAZIO-KOEFIZIENTEEN INTERPRETAZIO-ARAUAK

3.4. KORRELAZIOA ETA KAUSALITATEA

3.5. KORRELAZIO-KOEFIZIENTEAREN KALKULUA

3.5.1. 2 aldagai koantitatibo. Pearson-en koefizientea

3.5.2. 2 ordinal. Spearman-en koefizientea

3.5.3. 2 aldagai dikotomiko. Ø koefizientea

3.5.4. Dikotomiko bat eta koantitatibo bat. Biserial-puntuala

3.5.5. Dikotomizatu bat eta koantitatibo bat. Biseriala

3.5.6. Bi koalitatibo (edo dikotomiko). Kontingentzi koefizientea

3.5.7. Bi ordinal: Kendall-en Tau

3.6. KORRELAZIO ANIZKOITZA

3.7. KORRELAZIO PARTZIALA

3.8. KORRELAZIOAK SPSSWIN ERABILIZ

3.9. ERREGRESIOA

3.9.1. Erregresio lineala: oinarria eta kalkuluak

3.9.2. Erregresio lineal sinplea

3.9.3. SPSSWINekin lortutako emaitzak

3.10. ARIKETAK

Page 98: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 99: Estatistika teoria eta praktika SPSSWIN erabiliz

87

3. ESTATISTIKA DESKRIBATZAILEA. 2 ALDAGAI EDO GEHIAGO

3.1. SARRERA

Ikastetxe publiko eta pribatuen arteko ezberdintasunak aztertu nahi baditugu, edo eredu ezberdinen arte-koak, edo probintzia bakoitzeko gurasoen maila sozioekonomikoa aztertu nahi badugu, edo matemati-kako errendimenduak hizkuntzkoarekin zerikusirik ba ote duen ikusi nahi badugu,... bi aldagai bateraaztertzen ari gara eta, zenbait kasutan, hauen bien artean egon litezkeen erlazioak ikertzen.

Zientziaren helburuetako bat aldagaien arteko erlazioak aurkitzea dela eta estatistikak erlazio hauekaztertzen laguntzen duela jakinik, lan hau burutzeko estatistikak tresna egokiak garatu ditu.

Txikitan hiruko erregela zuzenaz eta alderantzizkoaz hitz egiten genuenean, 10 kilo patata erosteakbat erosteak baino 10 bider gehiago balio zuela esaten genuen, edo lan bat egiteko, lau langilek bi lan-gilek behar zuten denboraren erdia aski zutela. Kasu hauetan erlazio zehatz bat dago patata-kiloa eta pre-zioa aldagaien artean, eta lana egiteko behar den denbora eta langile-kopuruaren artean.

Gizarte Zientzietan erlazioak ez dira inoiz hain zehatzak, gehienetan joerak baino ez dira: pertsonaaltuek baxuek baino gehiago pisatzen dute eta, normalki, neurri handiagoko zapata erabiltzen dute,...Pertsona argiek eta ikasteko ohitura onak dituztenek nota hobeak ateratzeko joera dute,... Baina zapata-ren neurria jakinda ezin dugu pertsona baten altuera zehatza ezagutu, ezta pertsona baten adimen--kozientea eta ikasteko ohiturak jakinik ere bere errendimendu akademiko osoa iragarri.

Hau argitu ondoren, datozen lau grafikoetan aldagai koantitatiboen arteko erlazio desberdinak ikusditzagun:

3. erlazio alderantzizkoa 4. lerromakurra

1. ez dago erlazio linealik

X

T

X

Y

X

Z

X

W

2. erlazio zuzena

Page 100: Estatistika teoria eta praktika SPSSWIN erabiliz

Lehenengo grafikoan fijatzen bagara joera argirik ez dagoela ikus dezakegu. Ezin dugu baieztatu Xenbalioak gehituz doazen neurrian, Yrenak gehituz edo txikituz doazenik. Kasu hau aldagaien artean ERLA-ZIO LINEALIK EZ DAGOEN kasua da.

Hurrengo bi grafikoetan (2 eta 3) joera garbiak badaudela ikus daiteke. 2. grafikoan Xen balioak han-dituz doazen eran, Yrenak ere handituz doaz. 3.ean, berriz, aurkako joera da. Xen balioa handituz doanneurrian, Yrena txikituz doa: aldagaien artean ERLAZIO LINEALA BADAGOEN kasuak dira. 2. grafikoa-ren kasuan erlazioa zuzena da eta korrelazio-koefizienteak balio positiboa izango du, aldiz 3. grafikoa-ren kasuan erlazioa alderantzizkoa dela esango dugu eta korrelazio-koefizientea negatiboa izango da.

Azkenik 4. grafikoan, EZ DAGO ERLAZIO LINEAL garbirik; ERLAZIOA LERROMAKURRA da. Kasuhonetan kurba U itxurakoa da, baina besteetan, bi aldagaien arteko erlazioen irudikapen grafikoak besteitxura bat har dezake. Azaldu nahi nizukeen gauza bakarra hauxe da: bi aldagaien artean erlazio linealikez emateak ez du esan nahi bien artean erlaziorik ez dagoenik.

Erlazio-mota desberdinak badirela ikusi dugu. Guk, gai honetan, erlazio LINEALAZ bakarrik jardungodugu. Gainerantzeko erlazioak (esponentzialak, polinomikoak...) liburu honen helburuetatik kanpodaude.

Bi aldagaien arteko erlazioa planteatzean bi aldagaiok zein motatakoak diren gogoan izan beharko da.Aurreko kapituluan, aldagai kategoriko edo koalitatiboen batezbestekoa kalkulatzeak zentzurik ez zuelagenioen (adibidez, pertsona-talde bateko sexu aldagaiaren batezbestekoa); kapitulu honetan, aldagaizehatz batzuekin bakarrik zentzua izango duten batezbesteko edo indizeak aztertuko ditugu.

Aldagaien arteko erlazioak eta aipatu erlazioa koantifikatzeko moduak deskribatzen saiatuko naiz, lor-tzen ditugun emaitzen interpretazio-pausoak azalduz, bai eskuz edo baita SPSSWIN paketea erabiliz ere.

Adierazpen grafikoekin hasiko gara.

Erlazio baten adierazpen grafikoa. Erlazio-moten definizioa

Estatistikak aldagaien arteko erlazioa aztertzeko neurri edo indize ezberdinak eskaintzen ditu, baina adie-razpen grafikoek, erlazio hori azaltzeko garaian, laguntza ordainezina eskaintzen dute.

Erabilterrezena dispertsio-diagrama da. Lehen aurkeztu ditugun 4 adibideak dispertsio-diagramakziren.

Ikus dezagun zeintzuk diren eman behar diren pausoak, LIBURU.SAV fitxategia kargatu ondoren,SPSSWIN erabiliz, RAVEN (adimena neurtzen du) eta MATEMATI aldagaien dispertsio-diagrama lortu ahalizateko.

GráficosDispersión...

Eta Simples hautatuko dut (Definir).

Eje Y: Raven

Eje X: Matemati(Aceptar)

Eta emaitza hau da:

88

Page 101: Estatistika teoria eta praktika SPSSWIN erabiliz

Aurreko grafikotik abiatuz, erlazio-mota azter daiteke. Ikusten denez joera hau da: zenbat eta RAVENhandiagoa, eskuinalderago, orduan eta MATEMATI handiagoa, gorago. Edo beste era batera esanda,MATEMATIren balioa handituz doan neurrian, RAVENarena era handituz doa. Egia da inoiz ez delaRAVENen 60 balioa gainditzen. Logikoa; frogaren goimuga da. Ikasgai batean 10 inoiz gainditzen ez denbezalaxe.

RAVEN edo MATEMATI aldagaien artean dagoen erlazioa positiboa edo zuzenekoa dela esango dugu.Hau da, RAVENen puntuazioa zenbat eta handiagoa, MATEMATIrena ere handiagoa izango da eta alde-rantziz, MATEMATIrena zenbat eta puntuazio txikiagoa, orduan eta txikiagoa RAVENena ere.

Hemendik, aldagaien arteko erlazio zuzenaren definizioa enuntzia dezakegu.

Bi aldagaik, X eta Yk,erlazio lineal zuzena edo positiboa dutela esango dugu, Yren balio altuek Xenbalio altuekin parekatzeko joera azaltzen dutenean, Yren erdiko balioek Xen erdikoekin pareka-tzeko joera azaltzen dutenean eta Yren balio baxuek Xen baxuekin parekatzeko joera azaltzendutenean.

Irakurleak, aurreko dispertsio-diagraman, joera hau dela froga dezake.

Modu berean ALDERANTZIZKO erlazioa defini dezakegu.

Bi aldagaik, X eta Yk, erlazio lineal alderantzizkoa edo negatiboa dutela esango dugu, Yren balioaltuak Xen balio baxuekin, Yren erdiko balioak Xen erdikoekin, eta Yren balio baxuak Xen balioaltuekin konbinatzeko joera azaltzen dutenean.

Azkenik, erlaziorik eza edo erlazio baliogabea definituko dugu.

Bi aldagaien artean erlazio lineal baliogabea edo erlaziorik ez daukatela esaten da, aldagai bateneta bestearen balio altu, erdiko eta baxuen artean konbinazio sistematikorik ez dagoenean.

Hau orokorrean da, baina aldagai-mota ezberdinak daudela kontuan hartzen bada, kasu diferenteakizango dira. Zenbaitetan, aldagaien izaerak aipatu berri diren testuinguruetan iharduten ez dute utziko.Adibide bat jarriko dut. Aldagai dikotomiko edota koalitatiboen kasua da. Adibidez, lagineko subjektuen

89Estatistika deskribatzailea. 2 aldagai edo gehiago

RAVEN

706050403020

MA

TE

MA

TI

40

30

20

10

0

Page 102: Estatistika teoria eta praktika SPSSWIN erabiliz

sailkapenaz hitz egiten badugu sexua eta hizkuntz ereduari dagokionean, LIBURU.SAV datu-fitxategiakargatu ondoren eta honako hautaketa eginda:

EstadísticosResumir

Tablas de contingencia...

fila(s)-en SEXUA eta columnas-en EREDUA jarriko ditugu. (Aceptar)

Sarrera bikoitzeko taula hau lortuko dugu, bertan ikastetxe-mota bakoitzera zenbat gizon eta zenbatemakume doazen deskribatzen digularik.

SPSSWIN 6.1.3

SEXUA by EREDUA

EREDUACount

A EREDUA B EREDUA D EREDUARow

1,00 2,00 3,00 TotalSEXUA

GIZONA 1 36 28 6112540,2

EMAKUMEA 2 57 62 6718659,8

Column 93 90 128 311Total 29,9 28,9 41,2 100,0

7.5 bertsioan

SPSSWIN 7.5

Tablas

Kasu honetan, eta kategoria bakoitzari balio bat eman badiogu ere, erlazio zuzen edo alderantzizkoazhitz egiteak ez du zentzurik. Eredu bakoitzean sexu bakoitzeko pertsona-kopuruaz hitz egin ahal izangodugu (36 gizon eta 57 emakume A ereduan, 28 gizon eta 62 emakume B ereduan eta 61 gizon eta 67emakume D-n) eta baita kategoria-konbinaketa bakoitzaren deskribapenak egin ere; berauetako bakoi-tzaren subjektu-portzentaiaz hitz egin ahal izango dugu (egokiak deritzogun portzentaiak gelaska edokoadrotan hautatuz) eta, aurrerago ikusiko den bezala, erlazio hori ere koantifikatu ahal izango dugu,baina ezingo dugu berorren norabide edo zentzuaz hitz egin.

Aurreko bi kasuen artean bada beste bat, aldagai ordinalena hain zuzen.

36 28 61 125

57 62 67 186

93 90 128 311

GIZONAEMAKUMEA

SEXUA

Total de grupo

AEREDUA

BEREDUA

DEREDUA

EREDUATotal degrupo

90

Page 103: Estatistika teoria eta praktika SPSSWIN erabiliz

Aitaren eta amaren ikasketen arteko erlazioa aztertu nahi badugu, kontingentzi (behekoena) taula batlor dezakegu. Hemen, erlazioaren zuzenbideaz hitz egin dezakegu. Taularen irakurketa arretatsuak, amakgoi-mailako ikasketak dituen kasu gehienetan, aitak ere hala dituela ondorioztatzen laguntzen digu (15kasutatik 11). Modu berean, ikasketarik ez dutela esaten duten 26 emakumetatik, 13 kasutan senarrek eregauza bera diote. Erdialdeko kasuak ere beraien artean parekatzen dira. Erlazio zuzena bezala definitudugunera egokitzen dela ikusten dugu.

SPSSWIN 6.1.3

AITAIKAS AITAREN IKASKETA-MAILA by AMAIKASK AMAREN IKASKETA-MAILA

AMAIKASK Count

GOI MAILA- ERDI BIGARREN LEHEN IKASKETA-KOAK: U MAILAKOAK HEZKUNTZA HEZKUNTZA RIK GABE Row

1 2 3 4 5 TotalAITAIKAS

GOI MAILAKOAK: 1 11 10 9 7 3711,5

ERDI MAILAKOAK 2 13 18 14 2 4714,6

BIGARREN HEZKUNT 3 2 13 31 34 3 8325,7

LEHEN HEZKUNTZA 4 1 2 26 90 8 12739,3

IKASKETARIK GABE 5 1 2 3 10 13 299,0

Column 15 40 87 155 26 323

Total 4,6 12,4 26,9 48,0 8,0 100,0

7.5 bertsioan.

SPSSWIN 7.5

Tablas

GOI MAILAKOAK:UNIBERTSITARIOAK

GOI MAILAKOAK:UNIBERTSITARIOAK

11 10 9 7 37

13 18 14 2 47

2 13 31 34 3 83

1 2 26 90 8 127

1 2 3 10 13 29

15 40 87 155 26 323

ERDI MAILAKOAK

BIGARRENHEZKUNTZAKOIKASKETAKLEHEN HEZKUNTZA(OHO)AMAITUAIKASKETARIKGABEA

AITARENIKASKETAMAILA

Tot al de gr upo

ERDIMAILAKOAK

BIGARRENHEZKUNTZAKO

IKASKETAK

LEHENHEZKUNTZA

(OHO)AMAITUA

IKASKETARIKGABEA

Tot al degr upo

AMAREN IKASKETA-MAILA

91Estatistika deskribatzailea. 2 aldagai edo gehiago

Page 104: Estatistika teoria eta praktika SPSSWIN erabiliz

Azkenik, bi aldagai-mota bata koalitatiboa edo kategorikoa eta bestea koantitatiboa edo zenbakizkoa,konbinatzen dituen kasu bat dugu. Adibidez, probintzia (PROBINTZ) eta matematikako frogen emaitza-ren arteko erlazioa ikusi nahi dugu. Kasu honetan erlazioaz hitz egitea baino hobe da konparazioaz hitzegitea, errealitatean probintzia desberdinetako ikasleek matematikako frogan ateratako emaitzak konpa-ratzen ari baikara (nahiz eta, aurrerago ikusiko dugun bezala, erlazio edota konparazio hau koantifika-tzeko aukera izango dugun). Emaitzak lortu ahal izateko eginiko hautaketa honakoa izan da:

EstadísticosComparar medias

Medias...

Lista dependiente-n, berriz, MATEMATI, eta independiente-n PROBINTZ jarri dugu.

Lortu ditugun emaitzak hauek dira:

SPSSWIN 6.1.3

- - Description of Subpopulations - -

Summaries of MATEMATIBy levels of PROBINTZ

Variable Value Label Mean Std Dev Cases

For Entire Population 23,8875 4,8170 329

PROBINTZ 1,00 BIZKAIA 23,7283 3,9865 92PROBINTZ 2,00 NAFARROA 23,3247 5,1795 77PROBINTZ 3,00 ARABA 26,2386 4,8257 88PROBINTZ 4,00 GIPUZKOA 21,8194 4,2437 72

Total Cases = 335Missing Cases = 6 or 1,8 Pct

7.5. bertsioan.

SPSSWIN 7.5

MATEMATI23,73

923,99

23,3277

5,1826,24

884,83

21,8272

4,2423,89

3294,82

MediaNDesv. típ.MediaNDesv. típ.MediaNDesv. típ.MediaNDesv. típ.MediaNDesv. típ.

BIZKAIA

NAFARROA

ARABA

GIPUZKOA

Total

Informe

92

Page 105: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitzen goiburuak azaltzen duen bezalaxe azpipopulazioaren emaitzak deskrabitzean datza; gurekasuan, probintzia bakoitzean MATEMATIren emaitzak deskribatzea. Horretarako emaitza orokorrak des-kribatzen hasten da. Batazbestekoa= 23.89, Desbideratze tipikoa= 4.82 eta pertsona edo elementu-ko-purua= 329. Eta ondoren probintzia bakoitzeko emaitzak. Ikus dezakegunez, Gipuzkoako emaitzak besteprobintzietakoak baino handiagoak dira. Emaitzak aztertzea nahikoa erraza da. Ostera, erlazioaz hitz egi-tea nahikoa zaila egingo da, lehen aipatu den bezala, erlazioaz ez baino konparazioaz ari baikara.

3.2. ALDAGAIEN ARTEKO ERLAZIOAREN KOANTIFIKAZIOA

Aurreko kasuetan aldagaien arteko erlazio posibleak “ikusi” ditugu. Baina pertsonen arteko pisu eta altue-raren artean edo errendimendu akademikoa eta adimenaren artean erlaziorik badela esatea, gure helbu-ru den aldagaien arteko erlazioaren lehen pauso txiki bat besterik ez da.

Hemendik aurrera, formulak deskribatzen eta berauen aplikatzeko moduak deskribatzen saiatukogara, aldagaien arteko erlazioak KOANTIFIKATU ahal izateko.

Kasu honetan ere, aldagai-motak erlazioa koantifikatzeko erabili beharreko formula-mota baldintza-tuko digu. 7 kasu ezberdin aztertuko ditugu eta horietatik lehenengo lauak baliokide bezala har ditzake-gu, lehenengo formulatik baitatoz: Pearsonen korrelazio-koefizientea. Zazpi kasuak hauek dira:

1.- BI ALDAGAI KOANTITATIBO: PEARSONEN korrelazioa.

2.- BI ORDINAL: SPEARMANEN koefizientea.

3.- BI DIKOTOMIKO: Koefiziente TETRAKORIKOA.

4.- DIKOTOMIKO BAT ETA KOANTITATIBO BAT: Biserial-puntuala.

5.- DIKOTOMIZATU BAT ETA KOANTITATIBO BAT: Biseriala.

6.- BI KOALITATIBO (edo dikotomiko): KONTINGENTZI koefizientea.

7.- BI ORDINAL: KENDALL-en TAU

3.3. PEARSONEN KORRELAZIO-KOEFIZIENTEEN ETA BERE BALIOKIDEEN INTERPRETAZIO-ARAUAK

Korrelazio-koefizientea kalkulatzea gauza bat da, baina guretako garrantzi handia izango duena, emaitzaondo interpretatzea izango da. Beraz honekin, balioaren interpretazioarekin, hasiko gara.

Pearsonen korrelazio-koefizientea eta bere baliokideak interpretatzeko garaian, oinarrizko alderdi biizan behar dira gogoan: koefizientearen zeinua eta tamaina.

1.- Koefizientearen zeinuak erlazioa zuzena den (zeinu positiboa) ala erlazioa alderantzizkoa den (zeinunegatiboa) adieraziko du.

Ikasketa Ohituren eta Errendimendua aldagaien arteko zeinu positiboak, aldagaietako batean direnbalio altuak, beste aldagaiaren balio altuekin asoziatuak daudela adierazten du. Hau da, ikasteko ohi-tura onak dituzten pertsonek errendimendu onak dituzte, ikasteko ohitura eskasak dituztenek, erren-dimendu okerragoak dituzten bitartean. Beti joera, asoziazio,... hitzez arituko gara.

Korrelazio-koefizientean zeinu negatibo batek, aldagaien arteko alderantzizko erlazioa adierazten du;adibidez, moldaketa- edo adaptazio-arazoak eta errendimendua. Badirudi, ikasleek ikastetxera mol-datzeko zenbat eta arazo gehiago izan, orduan eta baxuagoa dela errendimendua. Alderantzizko erla-zioaren beste adibide argigarri bat ERRORE-KOPURUA eta LORTUTAKO PUNTUAZIOarena izan dai-teke. Errore-kopurua zenbat eta handiagoa izan orduan eta txikiagoa da lortutako puntuazioa.

Gogoan izan behar da, aldagaien arteko erlazioak neurtzean, beraien zeinua beti positiboa izango denkoefizienteak badirela; adibidez, bi aldagai koalitatiboren arteko erlazioa neurtzen duen kontingentzikoefizientea. Kasu hauetan, erlazioa aztertzeko, honen azterketa koalitatiboagoa egin behar da, kate-gorien konbinazio bakoitzaren maiztasuna aztertuz; hau da, laukitxo bakoitzaren maiztasuna. Eta koe-fizientearen kasuan ere, batezbestekoen diferentzien zentzuen azterketa koalitatiboa egin beharko da.

93Estatistika deskribatzailea. 2 aldagai edo gehiago

Page 106: Estatistika teoria eta praktika SPSSWIN erabiliz

2.- Koefizientearen tamaina

Kontuz! Hasi aurretik, gai honetan aztertzen ari garen erlazio bakarrak linealak direla azpimarratubehar dugu. Erlazio-mota honen existentzia koantifikatu bakarrik egingo dugu. ERLAZIO EZ LINEA-LEN KOANTIFIKAZIO ETA EXISTENTZIA EZ DUGU AZTERTUKO. Azterketa hau liburu honen hel-buruetatik at geratzen da.

Pearsonen korrelazio-koefizientea +1 eta -1en artean dagoen balioa da. Korrelazio-koefizientearenbalioa 0 bada, horrek ERLAZIORIK EZ DAGOELA adieraziko digu. +1 edo -1eko koefizienteak berriz,aldagaien arteko erlazio zehatza, osoa edo perfektua adieraziko du.

Aurrekoan oinarrituz honako hau esan daiteke: bi aldagairen arteko erlazioa zenbat eta txikiagoa izan,bere korrelazio-koefizientearen balioa 0tik hurbilago egongo dela eta erlazioa zenbat eta handiagoaizan, koefizientea +1 edo -1etik hurbilago egongo dela, erlazioaren zentzuaren arabera.

Bi aldagairen arteko erlazioaren tamaina gehiago zehazteko modu bat, gero erregresioari eskainitakozatian ikusiko dugun eta korrelazio-koefizientearen karratua bezala definitzen den DeterminazioKoefizientea izenekoak eskainiko digu.

Koefiziente hau aprobetxatuz baiezta dezakegu aldagaien arteko erlazioaren tamaina konparatzean ezdugula korrelazio-koefizientearen arabera egingo, korrelazio-koefizientearen karratura baizik. HorrelaX eta Y aldagaien arteko korrelazioa 0.4koa bada, Z eta T-rena 0.8koa den bitartean, ez dugu esangoX eta Yrena Z eta T-renaren erdia denik, 4 aldiz txikiagoa dela baizik, zeren bi koefizienteak karratu-ra jasotzen baditugu X eta Y: R2

xy = 0.16 lortzen dugu, aldiz Z eta T:R2zt = 0.64, hau da 4 aldiz gehia-

go.

Hurrengo grafikoan korrelazio-koefizientearen interpretazioaren adierazpen bat ikus dezakezu, bertanagertzen den geziaren zabalerak koefizientearen tamaina adierazten duelarik. Ikus dezakezunez, posi-tiboa edo negatiboa izan daiteke, eta zentzu bietan handia edo txikia.

Korrelazio-koefizienteen interpretazioaz hitz egiten ari garenean ohizko bi galderak hauek dira: alda-gaien artean erlaziorik badela baieztatu ahal izateko zein balio har dezakegu nahikoa bezala? Edonoiz baiezta dezakegu erlazio bat handia edo txikia dela?

Eremu konparatiboetan ez bada, zentzugabeko galderak dira hauek.

Parekotasun handiko adibide bat jarriko dizut. Bitxo edo zomorro bat handia dela esaten dugunean,zein neurritaz ari gara? Batzuetan oso labezomorro handiaz ari gara, era berean, arratoi txiki batbaino txikiagoa dena. Besteetan arratoi handi batez ari gara, era berean txahal txiki bat baino txikia-goa dena, edo zezen handi batez, era berean balea txiki bat baino txikiagoa dena... edo balea handi

94

Page 107: Estatistika teoria eta praktika SPSSWIN erabiliz

bati buruz, benetan, animalia-zomorroen eremuaren barnean handiena izango dena. Baina era bere-an, animalietatik at dauden beste “zomorroez” hitz egiten jardun gaitezke... Eta ez genuke inoiz amai-tuko.

Korrelazioen kasuan ere gauza bera gertatzen da. Aipatutako galderek ez dute inolako zentzurik, kon-paraketa baten barnean egiten ez badira.

Ingurune honetan mota honetako espresioak: 0tik, edo 1etik hurbil, edo erlazio txikia, handia, hauekeremu konparatiboan bakarrik ulertuak izan behar dute, eta mugitzen garen ingurunea eta laneandarabilzkigun aldagaiak kontuan izanik. 0.90eko korrelazio-koefiziente bat fisiko batentzat oso txikiaizan daiteke, eta aldiz, ingurune psikopedagogikoan hain handia gerta daiteke, berau lortzea ia ezi-nezko lana delarik.

Esandakoak esan, lehen aipatu bezala, determinazio-koefizientea-ren laguntzaz, korrelazio-koefi-zientearen tamaina gehiago zehaztuko dugu.

3.4. KORRELAZIOA ETA KAUSALITATEA

Egundoko nahastea dago edo egoten da bi kontzeptu hauen artean: erlazioa (korrelazioa) eta zergatia(kausalitatea). Hau dela eta, jarraitu baino lehen, bi kontzeptu hauei buruz bizpahiru gauza komentatunahi ditut gauzak argitzeko.

Ikerketa “sakon” baten ondorioz, ikastola batean, oinetako-zenbaki handienak zuten umeek probabatean emaitza hobeak lortzen zituztela ondorioztatu zen. NOSKI! Oinetako-zenbaki handiena zutenumeak zaharragoak eta kurtso gorenetakoak ziren... Bi aldagai hauen artean (oinetako-zenbakia eta pro-bako emaitzak) erlazioa badago, baina oinetako-zenbakia ez da probako emaitza honen zergatia... Kasuhonetan bi aldagaien artean dagoen erlazioa, ikastolako umeen adin ezberdinen ondorioz lortzen da.

Orokorrean, giza zientzietan lanean ari garenean ez da erraza izaten zergatiaz edo kausalitateaz hitzegitea. Aldagai bat bestearen zergatia dela, normalean, esperimentu baten ondorioz bakarrik esan deza-kegu. Bestelakoetan, “Kausa” edo “zergatia” hitzak oso arriskutsuak izango dira.

Kausalitateaz hitz egiteko, edo aldagai bat zergatia eta bestea ondorioa dela adierazteko, hiru puntuhauek bete beharko dira.

1.- Aldagai-kausak eta aldagai-ondorioak elkar erlazionatuta egon behar dute.

2.- Kausa, ondorioa baino lehenago eman behar da (denboran).

3.- Bi aldagaien arteko erlazioa baldintzatuko duen hirugarren aldagai bat ezin da erdian egon. Honi“espureitate” baldintza deitzen zaio. Lehen jarri den adibidean hau ez da betetzen.

Ikus dezagun “kausa”-z hitz egitea zail edo ezinezko egiten den bi adibide.

1.- Altuera eta pisuaren artean erlazioa badago. Egia da bi aldagaien artean erlazioa badagoela. Baina zerda lehenago? Zein da zergatia eta zein ondorioa?

2.- Matematikako notak eta Fisikakoak. Erlazio bat badago, eta batzuetan matematikako notak fisikakoakbaina lehenago jartzen dira, baina bata bestearen ondorioa dela adieraztea, noski, ezinezkoa da.

Beste batzuetan, ostera, posible egingo zaigu kausaz hitz egitea (hala ere eztabaida sortuz). Adibidez,esan dezakegu ikasteko ohiturak errendimendu eskolarra baldintzatzen duela eta bata (ohiturak) zergatiadela eta bestea (errendimendua) ondorioa. Edota tabakoa erre/ez erre eta biriketako minbiziaren arteanerlazioa badago eta, dirudienez, bata bestearen ondorioa litzateke.

Hau guztia kontuan hartuta, aldagaien arteko erlazioa neurtzeko erabiliko diren hainbat korrelazio--mota nola kalkulatzen den ikusiko dugu.

95Estatistika deskribatzailea. 2 aldagai edo gehiago

Page 108: Estatistika teoria eta praktika SPSSWIN erabiliz

3.5. KORRELAZIO KOEFIZIENTEAREN KALKULUA

3.5.1. 2 aldagai koantitatibo. Pearson-en koefizientea

Gai honen hasieran ikusi dugu RAVEN eta MATEMATIren arteko dispertsio-diagrama, eta han aipatzengenituen bi aldagairen arteko erlazioa positiboa zela. Bi aldagai hauen arteko erlazioa “neurtzeko” edoerlazio hau zehazteko, kasu honetan, bi aldagaiak zenbakizkoak edo koantitatiboak direlako, Pearson-enkorrelazio-koefizientea erabiliko da.

Esan beharra dago, Pearson-en koefizienteak aldagai koantitatiboen arteko erlazio linealak neurtzendituela bakarrik. Beste era bateko erlazioak (lerromakurrak...) neurtzeko beste indize batzuk erabili behar-ko dira.

Kalkuluak egiteko erabiliko dugun oinarrizko formula hau da:

Ikus dezakegu izendatzailea X eta Y aldagaien desbideratze tipikoen biderketa dela; eta zenbakitzai-lea bi aldagaien arteko kobariantza. Hau dela eta, batzuetan, lehengo formula era honetara idatz deza-kegu:

Kalkuluak eskuz egin nahi baditugu, ikus dezagun kasu zehatz batean jarraitu beharreko prozesuazein den.

Demagun bi aldagai hauek ditugula:

Xi: Kurtso-hasieran egindako test batean, 10 ikaslek lortu zituzten emaitzak.

Yi: Ikasleen kurtso-amaierako notak.

Hasierako taula lehenengo bi zutabeek osatzen dutena da, eta hauetatik abiatuz ondorengoak osatuditugu: X2, Y2 eta Xi*Yi

Xi Yi X2 Y2 Xi * Yi

15 6 225 36 9014 5 196 25 7016 7 256 49 11212 4 144 16 4816 7 256 49 11210 5 100 25 5020 8 400 64 16015 7 225 49 10512 5 144 25 6020 6 400 36 120

150 60 2346 374 927

x,y

i i

r =

( X *Y )

nX * Y

Sx* Sy=

Sxy

Sx * Sy

∑−

x,y

i i

i2

2 i2

2

r =

( X * Y )

nX * Y

Xn

( X ) * Yn

(Y )

∑−

∑−

∑−

96

Page 109: Estatistika teoria eta praktika SPSSWIN erabiliz

Lehenengo, X eta Yren batezbestekoa kalkulatuko dugu:

Eta hemendik korrelazio-koefizientea aterako dugu:

Korrelazio-koefizientea lortu ondoren, gure kasuan 0.7364, emaitza honen esanahia aztertu beharradago. Korrelazio-koefiziente hau ikusi ondoren, bi aldagai hauen artean erlazio “handia” dagoela esandezakegu, gure emaitza 1 baliotik nahiko hurbil baitago. Aldagaien arteko harremana zuzena edo positi-boa da, hau da, kurtso-hasierako testean zenbat eta emaitza hobea lortu hainbat eta nota hobea esperoda kurtso-amaierako notetan.

Mugatze- edo determinazio-koefizientea (R2), korrelazio-koefizientearen berredura bezala definitzenbadugu, kasu honetan R2ren balioa: 0.73642= 0.5422 izango da. (Honek adierazten du, aldagai batenaldaketatik, zati bat, % 54.22, beste aldagaiaren aldaketatik batera doazela).

3.5.2. Bi ordinal. Spearmen-en koefizientea: rs

X eta Y aldagaiak, biak ordinalak direnean edo eskala ordinal batera murriztuak izan direnean,Spearmanen korrelazio-koefizientea erabiliko da: rs.

Bere interpretazioa Pearsonen korrelazio-koefizientearen berdina da. Bere balioa +1 eta -1en arteandago.

Beronen kalkulurako erabiliko den formula hau da:

non:di: X aldagaian eta Y aldagaian subjektu baten ordenaren arteko diferentzia den.n: lagineko kasu-kopurua den.

Ikus dezagun kasu praktiko bat. Demagun 10 pertsonek atletismoko bi frogetan parte hartu dutela:altuera-jauzian eta 100 metroko lasterketan. Frogetako bakoitza amaitzean zein ordenatan geratu direnjakiteko 100 metro eta ALTUERA zutabeak dauzkagu. Hemendik aurrera bi zutabe berri eraikiko ditugu:di, aurreko zutabeetako balioak kenduz, eta d2i, aurreko zutabeko diferentziak karratura jasoz.

si2

2r = 1

6 dn( n -1)

−∑

x,yr =92.7 - 90

234.6 225 * 37.4 36=

2.7

9.6 * 1.4=

2.7

3.66= 0.7364

− −

x,y

i i

i2

2 i2

2 2 2

r =

( X * Y )

nX * Y

Xn

( X ) * Yn

( Y )

=

927

1015* 6

2346

1015 *

374

106

∑−

∑−

∑−

− −

X Y= = = =150

1015

60

106,

97Estatistika deskribatzailea. 2 aldagai edo gehiago

Page 110: Estatistika teoria eta praktika SPSSWIN erabiliz

Ikaslea 100 metro Altuera di d2i

A 1 7 –6 36B 2 6 –4 16C 3 9 –6 36D 4 10 –6 36E 5 8 –3 9F 6 5 1 1G 7 1 6 36H 8 3 5 25I 9 4 5 25J 10 2 8 64

284

Hemendik korrelazio-koefizientea lortuko dugu:

Emaitza interpretatzeko garaian, lehenik negatiboa dela ikusten dugu. Datuak arretaz begiratzen badi-tugu, froga batean lehenengo bosten artean daudenak, beste frogako azken bostak direla ikus dezakegu.Honek, dagoen erlazioa alderantzizkoa dela esaten digu: zenbat eta emaitza hobea lortu froga batean,okerragokoa bestean, eta alderantziz. Begira ezazu arretaz eta emaitza negatibo honen zergatia aurkitu-ko duzu.

Bestalde, erlazioa nahikoa garrantzitsua da, balioa 1etik nahikoa hurbil baitago. Aurreko esaldia, erla-zioaren tamaina baloratzeko garaian planteatutako erreparo guztiekin ulertu behar duzu.

Laburtuz, lasterketaren amaierako ordenak altuera jauziko ordenarekin alderantzizko erlazioa gorde-tzen duela daukagu. Hau da, lasterketan lehenak iristen direnek, motelek baino gutxiago saltatzen dute,motelak jauzi-proban lehen sailkatuak direlarik.

3.5.3. Bi aldagai dikotomiko: φφ koefizientea

Ikusten dugun hirugarren kasu hau ere Pearsonen korrelazio koefizienteen formularen ondorio edo aurre-ratze zuzen bat da. Beraz, lehen azaldutako interpretazio-arauak baliagarriak izango dira.

φ-ren formula, aldagai biak dikotomikoak direnean erabiliko dugu. Demagun 500 lagunei test psiko-metriko bat pasa diegula eta test honen lehenengo eta bigarren galderen emaitzen artean harremanik baote den jakin nahi dugula. Horretarako, ondoren azaltzen den bezala, gure datuak sarrera bikoitza duentaula batean jarriko ditugu.

Taula honetan ikus dezakegunez, 200 lagunek item biak ondo erantzun dituzte, 70k lehenengoa gaiz-ki eta bigarrena ondo, 60k lehenengoa ondo eta bigarrena gaizki, eta azkenik 170en emaitzak gaizkidaude bai lehenengo galderan eta bai bigarrenean.

Aurrera jarraitu baino lehenago, ondorengo taula eraikitzerakoan, kontuan hartu behar duzun gauzabakarra hau da: lehenengo itemean, lehen balorea, 1, ondo erantzuteari eta 0 gaizki erantzuteari esleitubaldin badiegu, bigarrenean orden eta balore berdinak erabili beharko ditugu.

si2

2r = 1

6 dn( n - 1)

= 16 * 284

10(100 - 1)= 1 1.7212 = 0.7212−

∑− − −

98

Page 111: Estatistika teoria eta praktika SPSSWIN erabiliz

ITEM 1 ONDO ITEM 1 GAIZKI

1 0

ITEM 2 ONDO 200 70 270

1 (a) (b) a + b

ITEM 2 GAIZKI 60 170 230

0 (c) (d) c + d

260 240

a + c b + d

Φ korrelazio-koefizientea kalkulatzea posible egiten duen formula ondoko hau da:

Taulan adierazi ditugu a, b, c eta d-ren balioak.

Item bien erantzunen artean dagoen erlazioa zuzena da, hau da, lehenengo itema ondo erantzutendutenek, gehienek, bigarrena ere ondo erantzuten dute, eta lehenengoa gaizki erantzuten dutenek, gehie-nek, bigarrenean ere hanka sartzen dute.

Oraingo honetan ez dugu galdera bi hauen emaitzen arteko erlazioa handia edo txikia den esango.

3.5.4. Dikotomiko bat eta koantitatibo bat. Biserial-puntuala

X aldagaietako bat dikotomikoa denean eta bestea koantitatiboa, kalkuluak eskuz egin behar baditugu,ondorengo formula erabiliko dugu, era berean Pearsonen koefizientearen formulatik datorrena:

non:p: 1 balioen maiztasun erlatiboa.q: 0 balioen maiztasun erlatiboa (p+q = 1).Xp: Y aldagaiak 1 balioa hartzen duten elementuetan, X aldagaien batezbestekoa.Xq: Y aldagaiak 0 balioa hartzen duten elementuetan, X aldagaien batezbestekoa.X: X aldagaien batezbestekoa.Sx: X aldagaien desbideratze tipikoa.

Kasu praktiko bat: Ikus dezagun, galdeketa bateko item zehatz bati ongi edo gaizki erantzutea etaproba batean lortutako emaitza orokorraren arteko erlazioa nola kalkula daitekeen. Aldagai bat, lehe-nengoa, dikotomikoa da eta bestea, zenbakizkoa edo koantitatiboa.

ITEM Xi: emaitza X2iorokorra

1 15 2250 14 1961 16 2560 12 1441 16 2560 10 1001 20 4001 15 2250 12 1441 20 400

150 2346

bp

p q

r =X X

Sxpq

φ =a * d b* c

(a + b)(c + d)(a + c)(b + d)=

200 * 170 70* 60

270 * 230 * 260 * 240= 0.4787

− −

99Estatistika deskribatzailea. 2 aldagai edo gehiago

Page 112: Estatistika teoria eta praktika SPSSWIN erabiliz

Formula aplikatzerakoan eman beharreko lehen pausoa Xp eta Xq kalkulatzea izango da:

Eta hemendik:

Korrelazio-koefiziente honen interpretazioa eta Pearson-en formulen emaitzen interpretazioa berdinakdira. Kasu honetan aldagaien arteko erlazioa positiboa eta nahikoa handia dela esan dezakegu.

Lagun batek item honetan erantzun ona eman badu, orduan, X aldagaian emaitza handia lortuko du(frogan puntu asko lortzeko joera dago); bestalde, X aldagaian emaitza eskasak lortzen dituztenek, gehie-netan, beste item hori ere gaizki erantzuten dute edo gaizki erantzuteko joera dago.

3.5.5. Dikotomizatu bat eta koantitatibo bat. Biseriala

Aldagai bat, adibidez X, koantitatiboa denean eta beste aldagaia Y DIKOTOMIZATUA den kasuetan apli-katzen da, jatorrizkoa jarraia eta banaketa normalekoa izanik.

ALDAGAI BAT DIKOTOMIZATUA DELA esango dugu, jatorrizkoa beste mota batekoa izanik, bi kate-goriatara murrizten denean. Hau da aldagai dikotomikoekiko duten ezberdintasuna. Dikotomikoek (adb.SEXUA) jatorriz bi kategoria dituzte. Aldiz dikotomizatuak besteak bi kategoriatara eraldatzetik sortzenda; adibidez, ikasleen notak bi kategoriatara eraldatzen direnean, GAINDITUA eta EZ-GAINDITUA; edopertsonak bere PISUAREN arabera GIZEN eta ARGALETAN sailkatzen direnean.

Gogora dezagun aurreko kasuan, aldagai koantitatibo bat eta dikotomiko bat behar zituen koefizien-te biserial puntualarekin lan egin dugula. Hemen, koefiziente biserialarentzat bata koantitatiboa da etabestea dikotomizatua. Hau da bi kasuen arteko ezberdintasunik funtsezkoena.

Formula hau da:

non:p: 1 balioen maiztasun erlatiboaq: 0 balioen maiztasun erlatiboa.Xp: Y aldagaiak 1 balioa hartzen duten elementuetan, X aldagaien batezbestekoa.

bp q

r =X X

Sx

pq

y=

−*

bpp q

r =X X

Sxpq =

17 12

3.09860.6 * 0.4 =

5

3.0986* 0.4898 = 0.7903

− −

tS = 9.6 = 3.0986

t2 i2

2 2S = Xn

( X ) =2346

1015 = 9.6

∑− −

X =150

10= 15p = 0.6q = 0.4

qX =14 +12+ 10+ 12

4=

48

4= 12

pX =15+ 16+ 16 + 20+ 15+ 20

6=

102

6= 17

100

Page 113: Estatistika teoria eta praktika SPSSWIN erabiliz

Xq: Y aldagaiak 0 balioa hartzen duten elementuetan, X aldagaien batezbestekoa.X: X aldagaien batazbestekoa.Sx: X aldagaien desbideratze estandarra.Y: banaketa normal tipikoan, bere ezkerretara p probabilitatea uzten duen puntuaren ordenatua

(altuera). (Balio hauek ondorengo taula erabiliz lor ditzakezu, baina, lehenik banaketa normala-ren taula erabili beharko duzu, hau 5. gaian aurkituko duzularik).

Ikus dezagun adibide bat.

Demagun egoera hau. Pisua eta altuera aldagaien artean dagoen erlazioa aztertu nahi dugu, baina bialdagaietako bat dikotomizatua daukagu. Hau da, pisuaren datuak baditugu, baina altuerari buruz eza-gutzen dugun bakarra hau da: altua bada(1) edo baxua(0).

Altuera Pisua

166 1

164 1

162 1

160 1

159 1

158 1

156 0

154 0

150 0

145 0

= 1574

Koefiziente biserialaren balioa lortzeko egin beharreko kalkuluak honako hauek dira:

P = 6/10 q = 4/10 z = 0.25 (banaketa normala)Batezbesteko osoa = 157.4 Sx = 6.40Xp = 161.5 Xq = 151.25pq = 0.24 y = 0.3867 pq/y = 0.6206

Eta hemen, korrelazio biserialaren koefizientearen emaitza:

Koefiziente biseriala ia 1 da. Gogoan izan behar dugu, koefiziente hau ez dela halabeharrez 0 eta 1enartean egongo. Zenbaitetan +1 baino balio handiagoak edo -1 baino txikiagoko balioak lortuko ditu.Koefiziente hau benetako balioaren hurbilketa bat da, aldagai dikotomizatuak jatorrizko balioak manten-duko lituzkeen kasurako. Normalki zertxobait “puztua” egoten da. Beraz, emaitzaren interpretazioa, ahalbada, kontu handiagoz egin beharko da.

Koefizientearen zentzua interpretatzerakoan, 1 balioari zein kategoria eman diogun eta 0 balioari zeineman diogun kontuan hartu behar dugu. Kasu honetan, pisua eta altuera aldagaien arteko erlazioa osoaltua dela esango dugu, eta zenbat eta pisu handiagoa orduan eta altuera handiagoa, eta alderantziz. Egiaesan, ondorio honetara iristeko ez zen hainbeste koefiziente eta hainbeste historia behar, baina... Horreladira gauzak. Adibide bat baino ez zen.

br =161.5 151.25

6.4*

0,24

0.3867=

10.25

6.4* 0.6206 = 0.9939

101Estatistika deskribatzailea. 2 aldagai edo gehiago

Page 114: Estatistika teoria eta praktika SPSSWIN erabiliz

102

Z

0.00.10.20.30.4

0.50.60.70.80.9

1.01.11.21.31.4

1.51.61.71.81.9

2.02.12.22.32.4

2.52.62.72.82.9

3.03.13.23.33.4

3.53.63.73.83.9

0

0.39890.39700.30100.38140.3683

0.35210.33320.31230.28970.2661

0.24200.21790.19420.17140.1497

0.12950.11090.09400.07900.0656

0.05400.04400.03550.02830.0224

0.01750.01360.01040.00790.0060

0.00440.00330.00240.00170.0012

0.00090.00060.00040.00030.0002

1

0.39890.39650.39020.38020.3668

0.35030.33120.31010.28740.2637

0.23960.21550.19190.16910.1476

0.12760.10920.09250.07750.0644

0.05290.04310.03470.02770.0219

0.01710.01320.01010.00770.0058

0.00430.00320.00230.00170.0012

0.00080.00060.00040.00030.0002

2

0.39890.39610.38850.37900.3653

0.34850.32920.30790.28500.2613

0.23710.21310.18950.16690.1456

0.12570.10740.09090.07610.0632

0.05190.04220.03390.02700.0213

0.01670.01290.00990.00750.0056

0.00420.00310.00220.00160.0012

0.00080.00060.00040.00030.0002

3

0.39880.39560.38850.37780.3637

0.34670.32710.30560.28270.2589

0.23470.21070.18720.16470.1435

0.12380.10570.08930.07480.0620

0.05080.04130.03320.02640.0208

0.01630.01260.00960.00730.0055

0.00400.00300.00220.00160.0011

0.00080.00050.00040.00030.0002

4

0.39860.39510.38760.37650.3621

0.34480.32510.30340.28030.2565

0.23230.20830.18490.16260.1415

0.12190.10400.08780.07340.0608

0.04980.04040.03250.02580.0203

0.01580.01220.00930.00710.0053

0.00390.00290.00210.00150.0011

0.00080.00050.00040.00030.0002

5

0.39840.39450.38670.37520.3605

0.34290.32300.30110.27800.2541

0.22990.20590.18260.16040.1394

0.12000.10230.08630.07210.0596

0.04880.03960.03170.02520.0198

0.01540.01190.00910.00690.0051

0.00380.00280.00200.00150.0010

0.00070.00050.00040.00020.0002

6

0.39820.39390.38570.37390.3589

0.34100.32090.29890.27560.2516

0.22750.20360.18040.15820.1374

0.11820.10060.08480.07070.0584

0.04780.03870.03100.02460.0194

0.01510.01160.00880.00670.0050

0.00370.00270.00200.00140.0010

0.00070.00050.00030.00020.0002

7

0.39800.39320.38470.37250.3572

0.33910.31870.29660.27320.2492

0.22510.20120.17810.15610.1354

0.11630.09890.08330.06940.0573

0.04680.03790.03030.02410.0189

0.01470.01130.00860.00650.0048

0.00360.00260.00190.00140.0010

0.00070.00050.00030.00020.0002

8

0.39770.39250.38360.37120.3555

0.33720.31660.29430.27090.2468

0.22270.19890.17580.15390.1334

0.11450.09730.08180.06810.0562

0.04590.03710.02970.02350.0184

0.01430.01100.00840.00630.0047

0.00350.00250.00180.00130.0009

0.00070.00050.00030.00020.0001

9

0.39730.39180.38250.36970.3538

0.33520.31440.29200.26850.2444

0.22030.19650.17360.15180.1315

0.11270.09570.08040.06690.0551

0.04490.03630.02900.02290.0180

0.01390.01070.00810.00610.0046

0.00340.00250.00180.00130.0009

0.00060.00040.00030.00030.0001

Banaketa normalean Z puntuan, Altuerak:

Page 115: Estatistika teoria eta praktika SPSSWIN erabiliz

103Estatistika deskribatzailea. 2 aldagai edo gehiago

3.5.6. Bi koalitatibo (edo dikotomiko). Kontingentzi koefizientea

Bi aldagaiak koalitatiboak edota dikotomikoak diren kasuetan, C kontingentzi koefizientea erabiliko da,bi aldagaien arteko erlazioa koantifikatzen lagunduko duelarik. Beste korrelazio-indizeak ez bezala, kon-tingentzi koefizientea BETI POSITIBOA DA. Aldagaien arteko erlazioaren zentzua, berorren analisi koa-litatiboaz baliatuz lortu beharko da, aurrerago azalduko ditugun pausoak jarraituz.

7. gaian informazio gehiago topatuko duzu aldagai koalitatiboen arteko erlazioaz, ji karratuaren fro-gaz. Gai honetan kontingentzi koefizientearen kalkuluaren prozesua bakarrik ikusiko dugu, baina alda-gaien arteko erlazioa aztertzeko gehien erabiltzen den neurrietako bat dela kontuan izanik, atal honetangehitzea bidezkoa ikusten dut.

Pentsa dezagun sexua eta Unibertsitateko karreren hautaketa aldagaien artean dagoen erlazioa azter-tu nahi dugula. Pentsa dezagun erregistro orokorrean agertzen diren datuen arabera 1.000 ikasle moduhonetan sailkatzen direla:

Informatika Kimika Pedagogia Psikologia Orokorrean

GIZONAK 100 150 100 150 500

EMAKUMEAK 50 50 200 200 500

Orokorrean 150 200 300 350

Gure asmoa bi aldagaien artean asoziazio/erlazio-maila koantifikatzea da.

Horretarako, ondorengo galdera erantzuten duten, balio berri batzuk eskuratuko ditugu: Nola banatubehar lirateke gizonezkoak eta emakumezkoak, sexuak karrera-hautaketarekin zerikusirik ez izateko?

Galdera honi erantzuteko, bi aldagaien artean erlaziorik ez egoteak, karrera guztietan gizonezkoak etaemakumezkoak berdin banatzen direla esan nahi lukeela, nabarmendu nahi nuke. Hau da, informatikanmatrikulatzen diren 150 pertsonetatik erdiak (75) emakumeak izan behar lukete eta beste erdiak (75) gizo-nak (guztira gizon eta emakume-kopuru bera baitugu). Berdin gertatu beharko luke gainerantzeko karre-retan ere: Kimikan 100 gizon eta 100 emakume; pedagogian 150 eta 150, eta azkenik, psikologian 175eta 175.

Hemendik, bigarren taula bat lortuko dugu, bertan esperotako maiztasunak (erlazio edo zerikusirik ezbalego izan beharko luketeenak) parentesi artean adierazi ditugularik.

Informatika Kimika Pedagogia Psikologia Orokorrean

GIZONA 100 (75) 150 (100) 100 (150) 150 (175) 500

EMAKUMEAK 50 (75) 50 (100) 200 (150) 200 (175) 500

Orokorrean 150 200 300 350

Lauki bakoitzeko bi balioen arteko diferentziak aldagaien arteko erlazioaren neurri bat ematen digu.Desproportziorik handiena kimikan dagoela ikusten dugu, non ikasten duten emakumeen kopurua eta% 50eko portzentaia errespetatuko balitz egon behar luketenen arteko diferentzia 50 ikaslekoa den.Diferentzia hau bera, baina aurkako zentzuan, Pedagogian gertatzen da.

Page 116: Estatistika teoria eta praktika SPSSWIN erabiliz

Erlazio hau koantifiatzeko C kontingentzi koefizientea lortuko dugu, ondorengo formulaz baliatuz:

non:

fi = ikusitako, lortutako maiztasuna.ft = maiztasun teorikoak.

Geure adibideko kasuan maiztasun teorikoa, ft, lortzea ez da arazo bat izan, baina irakurleak frogadezake nola, modu mekanikoan, emaitzak lortzeko aukera genuen hurrengo operazioa eginaz, laukibakoitzarentzat:

Prozesuarekin jarraituz, X2 balioa lortzeko emango ditugun pausoak hauek dira: esperotako eta beha-tutako maiztasunen arteko diferentzia kalkulatu, ondoren, diferentzi hau karratura jaso eta azkenik, emai-tza zati esperotako maiztasuna egin. Hurrengo taulan lauki bakoitzari, ordena honetan, gehitzen dizkio-gun hiru balioak daude:

Informatika Kimika Pedagogia Psikologia Orokorrean

GIZONAK 100 (75) 150 (100) 100 (150) 150 (175) 500

25 625 8.33 50 2500 25 –50 2500 16.66 –25 625 3.57

EMAKUMEAK 50 (75) 50 (100) 200 (150) 200 (175) 500

–25 625 8.33 –50 2500 25 50 2500 16.66 25 625 3.57

Orokorrean 150 200 300 350

Eta hemendik X2 balioa lortzeko, balio hauek batzea aski dugu:

X2 = 8.33+25+16.66+3.57+8.33+25+16.66+3.57 = 107.12

Eta kontingentzi koefizientea:

Lortutako koefizientearen emaitza 0 baliotik oso urrun ez dagoela ikusten dugu, horregatik sexua etahautatutako karreraren artean erlazioa badago ere, hau ez dela oso handia esan daiteke. Erlazioaren zen-tzua honakoa da: gizonak, proportzionalki, gehiago apuntatzen dira Kimika eta Informatikako karrereta-ra eta, emakumeak, aldiz, gehiago apuntatzen dira Psikologia eta Pedagogiara.

3.5.7.- Bi ordinal: Kendall-en TAU

Spearmanen koefizientean bezala, koefiziente hau bi aldagai ordinalen kasuan erabiltzen da.

Pentsa dezagun ondorengo egoera. Bertsolari-jaialdi batean, bi adituren iritzien arteko adostasun edokonkordantzia-maila frogatu nahi dugu. Horretarako, aditu bakoitzari, onenetik hasi eta okerrenera 6 ber-tsolari ordenean jar ditzatela eskatzen zaio.

C =n+

=107.12

1000 +107.12= 0.3110

2

2

Χ

Χ

tf =lerroa * zutabea

n

∑ ∑

22

i t

t

=( f f )

fΧ ∑

C =n +

2

2

Χ

Χ

104

Page 117: Estatistika teoria eta praktika SPSSWIN erabiliz

Egin duten sailkapena honakoa izan da:

1. epailea 2. epailea

1 A 3

2 B 2

3 D 1

4 E 5

5 F 4

6 G 6

Orain, gure lana, bi ordenak konparatu eta berauen arteko erlazioa koantifikatzea da. Horretarakohonako prozesua ematen da: bertsolariak 1. epailearen irizpidearen arabera ordenatzen dira. Lehen orde-na hau jarraituz, bertsolariak letren bidez izendatzen ditugu: A, B, D...

Bigarren epailearen ordenak kontuan hartuz, baita A ere lehen postuan jarri izan balu, ondorengobikoteen konparaketak eginda: A-B, A-D, A-E, A-F eta A-G, beti A-k bere bikoteari irabaziko lioke. Hauda 5 kasutan A-k irabazten du. Kasu hauek +1 bezala kontatuko ditugu eta A-k galtzen duenetan -1.Enpatea 0 kontatuko dugu. Bertsolari bakoitza hurrengoekin konparatuz joango gara 1. epaileak klasifi-katu dituen ordenean.

Gure adibidean:

A bertsolariaren kasuan, 2. epailearen konparaketen emaitzak:

A–B: (B irabazle) –1A–D: (D irabazle) –1A–E: (A irabazle)+1A–F: (A irabazle)+1A–G: (A irabazle)+1

B bertsolariaren kasuan, 2. epailearen konparaketen emaitzak:

B–D: (D irabazle) –1

B–E: (B irabazle) +1B–F: (B irabazle) +1B–G: (B irabazle) +1

D bertsolariaren kasuan, 2. epailearen konparaketen emaitzak:

D–E: (D irabazle)+1D–F: (D irabazle)+1D–G: (D irabazle)+1

E bertsolariaren kasuan, 2. epailearen konparaketen emaitzak:

E–F: (F irabazle)-1E–G: (E irabazle)+1

Azkenik, F bertsolariaren kasuan, 2. epailearen konparaketen emaitzak hauek dira:

F–G: (F irabazle)+1

Hemendik aurrera 15 konparaketen emaitza guztiak batzen baditugu S balioa lortuko dugu, gurekasuan hau da:

S = –1–1+1+1+1-1+1+1+1+1+1+1–1+1+1 = 7

105Estatistika deskribatzailea. 2 aldagai edo gehiago

Page 118: Estatistika teoria eta praktika SPSSWIN erabiliz

Ongi da, balio hauek guztiak lortu ondoren, Kendall-en Tau koefizientearen emaitza, ondoko formu-la hau aplikatuz lortuko dugu:

Emaitza honetatik ondoriozta genezake, orokorrean, bi epaileen sailkapenen artean erlazio positibo-ren bat badela, baina ikusia genuen bezala, erlazio hau ez da handiegia ezta osoa ere, horregatik, lortu-tako koefizientearen balioa 0 nahiz 1etik distantzia berera dago.

Edozein kasutan ere, ikus dezakegu sailkatutako lehen hiruak, 1. epailearen ustez, 2. epailearen ustezdauden berak direla eta 1. epailearentzat azken 3ak direnak ere, 2. epailearen azken 3ak direla.

2. KASUA: BERDINKETAREKIN KLASIFIKAPENEAN (Ordenazioan)

Ikus dezagun bigarren kasu bat, bertan aurreko egoera orokortzen dugularik. Imajina ditzagun 10 bertso-lariren jardunaldiak ordenatu behar zituzten aurreko epaileak. Baina kasu honetan, bietako batek, pun-tuazio berdinak eman dizkie zenbaiti. Ikus dezagun egoera hau.

Bertsolariak: A B D E F G H I J K

1. epailea: 1 2 3 4 5 6 7 8 9 102. epailea: 2 2 1 5 6 4 7 7 7 10

Kasu hauetan lehen erabilitako formulari aldaketa batzuk egingo dizkiogu. Formula berria hau da:

Bertan S, aurreko kasuan bezalaxe, bertsolari-bikote guztien ordenaketa-konparaketen batura da.

Non t, X aldagaiarentzat (edo 1. epailea) berdinketa bakoitzarentzat dagoen berdinketa-kasu kopuruada.

Non t, lehen bezala, Y aldagaiarentzat (edo 2. epailea) berdinketa bakoitzarentzat dagoen berdinketa--kasu kopurua da.

Gure kasuan, lehenengo epaileak ez du berdinketa-kasurik eman, beraz Tx = 0.

Bigarren epaileak bi berdinketa eman ditu, lehenengo kasuan bi bertsolari daude berdinduak eta bi-garrenean hiru. Hemendik lortuko dugu:

S -ren balioa kalkulatzea besterik ez zaigu geratzen.

Horretarako bertsolari bakoitza besteekin konparatu ondoreneko emaitzak kalkulatu beharko ditugu.A bertsolariarekin hasiko gara.

Ty =1

2[ t(t 1)] =

1

2[2(2 1)+ 3(3 1)] =

1

2[2 +6] = 4∑ − − −

Ty = (1

2)[ t(t 1)]∑ −

Tx = (1

2)[ t(t 1)]∑ −

Τ =S

1

2n(n 1) Tx

1

2n(n 1) Ty

=

− − − −

Τ =S

1

2n(n 1)

=7

1

26(6 1)

=7

15= 0.4667

− −

106

Page 119: Estatistika teoria eta praktika SPSSWIN erabiliz

A bertsolaria besteekin konparatu ondoreneko emaitzak, 2. epailearen ordenaren arabera, hauek dira:

Berdintasuna B-rekin: 0; galdu D-rekin: -1; irabazi E-rekin: +1, irabazi F-rekin: +1,... Guztira, A-renkonparaketen batura +6 da. B, D,...-en konparaketak eginaz joan zaitezke eta batura hauek lortuko ditu-zu bertsolari bakoitzarentzat:

B = 6; D = 7; E = 4; F = 3; G = 4; H = 1; I = 1; J = 1.

Batura osoa = 33.

Tx = 0, Ty = 4 eta S = 33ren balioak kalkulatu ondoren, korrelazio-koefizientearen kalkulua bere-halakoa da, formulan ordezkatzea besterik ez da:

Interpretazioa: koefiziente hau interpretatzeko garaian, aurreko koefizientetan bezalakoxe pausoakemango ditugu. Beraien balioak -1 eta +1en artean egongo dira.

Aurreko kasuan ondoriozta dezakegu bi epaileen arteko iritzien arteko harreman edo erlazioa handiadela (0.7683), lehenengo kasukoa baino handiagoa (0.4667).

3.6. KORRELAZIO ANIZKOITZA

Aurreko guztietan bi aldagaien arteko erlazioaz hitz egin dugu, aldiz, egoera askotan, aldagai bi edogehiagoren arteko erlazioa batera aztertzea interesatuko zaigu.

Adibidez, interesgarri suerta dakidake ikasteko ohiturak eta eskola-errendimenduaren artean dagoenerlazioa, baina baita ere interesgarri izan daiteke adimena eta eskola-errendimenduaren arteko erlazioaaztertzea. Eta azkenik, interesa dakiguke biek bat eginik eskola-errendimenduarekin izan dezaketen erla-zioa aztertzea, hau da, KORRELAZIO ANIZKOITZA. Koefiziente honen helburua, ALDAGAI BAT (X) ETABESTE ALDAGAI BATZUEN (Y,Z,T...) ARTEAN DAGOEN ERLAZIOA KOANTIFIKATZEA da, azken alda-gai hauek multzo bezala ulertuz.

X aldagaia alde batetik eta Z eta T aldagaien arteko korrelazio anizkoitza, Rx,zt izenarekin adierazikodugu. Era berean X1 aldagaiak X2, X3 eta X4 aldagaiekiko duen korrelazio anizkoitza adierazteko, hone-la idatziko dugu: R1,234.

Korrelazio anizkoitzaren koefizientearen berredurari Determinazio edo Mugatze-koefizientea deri-tzogu.

Korrelazio-koefiziente hau eskuz kalkulatzeko prozesua ez dugu hemen azalduko, Erregresioari eskai-nitako kapituluan sakonki aztertuko baitugu, baina interpretazio-arauren bat adierazi nahi nuke:

1.- Rx,zt, 0 eta 1en artean dagoen balio bat da. 1etik zenbat eta hurbilago egon handiagoa da erlazioa, eta0tik zenbat eta hurbilago egon txikiagoa izango da erlazioa.

2.- Erlazioaren tamaina bakarrik aztertu ahal izango dugu eta ez zeinu edo zentzurik. Beti positibo beza-la hartuko dugu korrelazio antzeko koefizientearen balioa. Ez dago X aldagaiaren eta Z, T aldagaienarteko erlazioaren zeinuaz hitz egiterik, banakako erlazioan zeinu ezberdina izan dezaketen aldagaiak

Τ =33

1

210(10 1) 0

1

210(10 1) 4

=33

45 41= 0.7683

− − − −

107Estatistika deskribatzailea. 2 aldagai edo gehiago

Page 120: Estatistika teoria eta praktika SPSSWIN erabiliz

taldeka erlazionatzen jardun baikaitezke. Horrela, interesatuak egon gaitezke adimena eta eskolaraegokitzeko arazoak errendimenduarekin izan dezakeen erlazioa modu taldekatuan aztertzeko. Erla-zioaren zeinua aztertzeko aldagaietako bakoitzaren azterketa zehatzera jo beharko dugu.

3.- Korrelazio anizkoitzeko koefizientearen balioa EZ DA IZANGO banakako korrelazioetako balioenbaturaren berdina. Berdintasun hau ez da determinazio anizkoitzeko koefizientearekin ere egiazta-tzen. Arrazoia oso da sinplea. Aldagai bi edo gehiagoren arteko erlazioa hirugarren batekin aztertzendugunean, aldagai guztiak beraien artean erlazionatuak daude. Horrela, aurreko adibidean adimenaeta eskolara egokitzeko arazoak ere beraien artean erlazionatuak daude. Baina R2

x,zt -ren balioa R2x,z

eta R2x,t -ren balioa baino handiagoa izango da. Hau da, bi aldagaik hirugarren batekin izango duten

talde-erlazioa beti handiagoa edo berdina izango da, bakoitzak hirugarrenarekin izan dezakeen bana-kako erlazioa baino.

3.7. KORRELAZIO PARTZIALA

Zenbaitetan bi aldagairen arteko erlazioa aztertzea interesgarria izan daiteke, baina erlazio honetan hiru-garren batek edo gehiagok izan dezaketen eragina deuseztuz. Adibidez, eskola-errendimendua eta ikas-teko ohituren artean dagoen erlazioa azter genezake, erlazio honetan eskola-egokitzapenak izan dezake-en eragina deuseztuz. Edo erlazioa bera, baina eskola-egokitzapenak eta ahozko-ulermenak izan deza-keten eragina deuseztuz, edo...

Galdera hauen atzean KORRELAZIO PARTZIALEKO kontzeptua ezkutatzen da. Bi aldagairen artekoerlazioa neurri bat da, erlazio honetan beste batek edo batzuk izan dezaketen eragina deuseztuz.

X eta Y aldagaien erlazioari Z aldagaiaren eragina kenduz geratzen den erlazioari erlazio partziala dei-tuko diogu, eta honen balioa adierazteko erabiliko dugun koefizientea korrelazio-koefiziente PARTZIALAizango da eta honela idatziko dugu: rxy,z, X3 eta X4 aldagaien eragina deuseztuz lortuko dugunkorrelazio-koefiziente partziala honela idatziko dugu: r12,34.

INTERPRETAZIOA: Pearsonen korrelazio-koefizientearen berdin-berdina da, bai tamainaren interpre-tazioari dagokionez (-1 eta +1en artean) eta bai honen zentzu positibo edo negatiboari dagokionez ere.

KALKULUA: X1 eta X2 aldagaien korrelazio partzialaren koefizientea, X3 aldagaiaren eragina deu-seztuz, lortzeko formula hau da:

ADIBIDEA: Eskola-errendimendua (X) eta autokontzeptuaren (Y) arteko korrelazioa (rxy) 0.70 da, bainaeskola-errendimendua eta eskola-egokitzapenaren artean (Z) rx z= 0.80ko korrelazioa kalkulatu dugulabadakigu, eta autokontzeptua eta eskola-egokitzapenaren arteko korrelazio ryz = 0.90 dela ere badakigu.Eskola-errendimendua eta autokontzeptuaren arteko korrelazio-koefizientea kalkulatzea planteatu dugu,eskola-adaptazioaren eragina deuseztuz (edo eskola-adaptaziotik aparte).

Badakigu: rxy = 0.70, rxz = 0.80 eta ryz = 0.90 direla, baina

rxy,z-ren balioa kalkulatu nahi dugu. Horretarako aurreko formula erabiltzea aski da, eta honakoa lor-tuko dugu:

12.312 13 23

212

213

2 2r =

r r r

1 r 1 r=

0.70 0.80 * 0.90

1 0.80 1 0.90= 0.0764

− −

− −

12.312 13 23

212

213

r =r r r

1 r 1 r

− −

108

Page 121: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitza honen interpretazioa gainerantzeko korrelazio-koefizienteen antzekoa da. Emaitza hauetatikondorioztatuko genuke, eskola-errendimenduaren eta autokontzeptuaren artean erlazio garrantzitsuadagoela (rxy = 0.70). Baina erlazio honetatik eskola-egokitzapenaren eragina deusezten badugu, erlazio

hau kasik baliogabea da. Emaitza honek eskola-errendimendua eta autokontzeptuaren arteko erlazioa,eskola-egokitzapenak ia guztiz baldintzatzen duela aditzera emango luke. Baina hau korrelazio partzia-leko koefiziente honen erabilpenak azaltzeko erabili dudan adibide bat baino ez da.

3.8. KORRELAZIOAK SPSSWIN ERABILIZ

SPSSWINekin korrelazioak lortzeko ez dugu arazorik izango.

Korrelazio-koefizientearen kalkuluan murgildu aurretik, kalkulatu nahi den korrelazio bibariatuko koe-fizientea (arrunta, sinplea...) den edo korrelazio partzialeko koefizientea den jakin behar da.

Demagun, gure lehengo adibidean, 5 ikasgaietako noten artean zer erlazio dagoen jakin nahi dugula:NOTAMATE, NOTAINGE, NOTALENG, NOTAFISI eta NOTAEUSK. Korrelazio bibariatuak, binakakoak,beraz, baina bost aldagaienak bata bestearekiko.

LIBURU.SAV fitxategia kargatu ondoren, korrelazio hauek kalkulatzeko, eman beharreko pausoakhonakoak dira:

EstadísticosCorrelaciones

Bivariadas...

Eta hemen “variables” -en atalera erlazionatu nahi ditudan bost aldagaiak pasa beharko ditut. Honenantzeko pantaila bat izango dut.

Kalkulatuko dudan korrelazio-koefiziente mota hautatu beharko dut. Aldagaiak koalitatiboak badira,PEARSON koefizientea hautatuko dut, baina ordinalak badira beste bietako edozein. Gure kasuan, ikusdezakezun bezala, Pearson hautatu dut eta printzipioz gainontzeko aukerak utz ditzaket defektuz dato-zenak bezala.

Prueba de Significación: Bilateral, eta Marcar las correlaciones significativas edo Nivel crítico akti-batu. Aukeren artean aldagaietako bakoitzaren desbideratze tipikoak eta batezbestekoak kalkulatzekoaukera ematen dit hala nola bariantzen eta kobariantzen matrizea.

Beraz, aurrekoaren antzeko pantaila lortzean, Aceptar sakatuko dugu.

109Estatistika deskribatzailea. 2 aldagai edo gehiago

Page 122: Estatistika teoria eta praktika SPSSWIN erabiliz

Gure kalkuluaren emaitza bezala, bertsio bakoitzarentzat ondorengoak lortuko ditugu:

SPSSWIN 6.1.3- - Correlation Coefficients - -

NOTAEUSK NOTAFISI NOTALENG NOTAINGL NOTAMATE

NOTAEUSK 1,0000 ,5245 ,5987 ,5545 ,5581( 305) ( 305) ( 305) ( 305) ( 305)P= , P= ,000 P= ,000 P= ,000 P= ,000

NOTAFISI ,5245 1,0000 ,5060 ,4982 ,5992( 305) ( 311) ( 311) ( 310) ( 311)

P= ,000 P= , P= ,000 P= ,000 P= ,000

NOTALENG ,5987 ,5060 1,0000 ,4852 ,5259( 305) ( 311) ( 311) ( 310) ( 311)P= ,000 P= ,000 P= , P= ,000 P= ,000

NOTAINGL ,5545 ,4982 ,4852 1,0000 ,4599( 305) ( 310) ( 310) ( 310) ( 310)

P= ,000 P= ,000 P= ,000 P= , P= ,000

NOTAMATE ,5581 ,5992 ,5259 ,4599 1,0000( 305) ( 311) ( 311) ( 310) ( 311)P= ,000 P= ,000 P= ,000 P= ,000 P= ,

(Coefficient / (Cases) / 2-tailed Significance)

“ , “ is printed if a coefficient cannot be computed

Aurreko taulan aurkezturiko datu-taldeari KORRELAZIO-MATRIZEA deritzo. Sarrera bikoitzeko taulada; bertan, 5 aldagaien arteko korrelazioak azaltzen zaizkit binaka-binaka hartuak. Matrize hau simetri-koa da; logikoki, matematika eta fisikako noten arteko erlazioa eta fisika eta matematikako noten artekoabera da.

Aldagai-bikote bakoitzarentzat hiru balio aurkezten dizkigu: lehenengoa korrelazio-koefizientea da.Bigarrengoa (parentesi artean) kalkulu hau egiteko erabili den subjektu-kopurua da. Kalkulu batetik bes-tera aldaketa txikiak daude. Hau, galdutako datuak badaudelako gertatzen da. Hirugarren balioa esangu-ra probaren emaitza da. Hau 6. gaian aztertuko dugu.

Emaitza hauek berak 7.5 bertsioan ondorengo moduan aurkezten zaizkigu:

SPSSWIN 7.5

Correlaciones

110

NOTAEUSK

NOTAFISI

NOTAINGL

NOTALENG

NOTAMATE

NOTAEUSK

NOTAFISI

NOTAINGL

NOTALENG

NOTAMATE

NOTAEUSK

NOTAFISI

NOTAINGL

NOTALENG

NOTAMATE

Correlación

de Pearson

Sig.

(bilateral)

N

NOTAEUSK NOTAFISI NOTAINGLNOTALENG NOTAMATE

Correlaciones

La correlación es significativa al nivel 0,01 (bilateral).**.

**

**

**

**

,558

,599

,526

,460

1,000

,000

,000

,000

,000

,

305

311

310

311

311

,599

,506

,485

1,000

,526

,000

,000

,000

,

,000

305

311

310

311

311

**

**

**

**

,555

,498

1,000

,485

,460

,000

,000

,

,000

,000

305

310

310

310

310

**

**

**

**

,524

1,000

,506

,498

,599

,000

,

,000

,000

,000

305

311

310

311

311

**

**

**

**

1,000

,524

,599

,555

,558

,

,000

,000

,000

,000

305

305

305

305

305

**

**

**

**

Page 123: Estatistika teoria eta praktika SPSSWIN erabiliz

Korrelazio-koefizienteen interpretazioan pixka bat erreparatzen badugu, guztiak positiboak direlaikusten dugu. Logikoa da. Eta bestalde, erlazio handienak, batetik, matematika eta fisikako noten artean(0.5992) eta, bestetik, gaztelania eta euskarazko noten artean daudela (0.5987) ere ikus daiteke.Korrelazio txikienak ingeleseko notekin ematen direla ere ikus dezake irakurleak.

Korrelazio partzialeko koefizientearen kalkulua

Pentsa dezagun aurreko bost aldagaien arteko erlazioa aztertu nahi dugula, baina orain ikastetxe priba-tuetan, eta publikoetan ezberdin puntuatzen den eztabaidan sartuz; IKASTETXE PUBLIKO/IKASTETXEPRIBATU (PUBPRIBA) aldagaiak puntuaketa ezberdinen arteko erlazioan izan dezakeen eragina deusez-tu nahi dugu.

Nahi ditugun emaitzak lortzeko eman beharreko pausoak:

EstadísticosCorrelaciones

Parcial...

Eta hemen erlazionatu nahi ditugun aldagaien izenekin Variables atala bete beharko dugu: NOTA-EUSK, NOTAMATE... eta Controlar para atalean, bere eragina kontrolatzeko erabili nahi dugun alda-gaiaren izena idatzi beharko dugu: PUBPRIBA.

Eta begi-bistan honen antzeko pantaila edukiko dugu:

Aceptar.

Eta ondorengo emaitzak lortuko ditugu, darabilzkigun bi bertsioetan modu berean azaltzen zaizkigularik:

111Estatistika deskribatzailea. 2 aldagai edo gehiago

Page 124: Estatistika teoria eta praktika SPSSWIN erabiliz

112

– P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S –

Controlling for.. PUBPRIBA

NOTAEUSK NOTAFISI NOTAINGL NOTALENG NOTAMATE

NOTAEUSK 1,0000 ,5240 ,5533 ,6005 ,5576( 0) ( 302) ( 302) ( 302) ( 302)

P= , P= ,000 P= ,000 P= ,000 P= ,000

NOTAFISI ,5240 1,0000 ,4899 ,5119 ,6110( 302) ( 0) ( 302) ( 302) ( 302)P= ,000 P= , P= ,000 P= ,000 P= ,000

NOTAINGL ,5533 ,4899 1,0000 ,4960 ,4626( 302) ( 302) ( 0) ( 302) ( 302)P= ,000 P= ,000 P= , P= ,000 P= ,000

NOTALENG ,6005 ,5119 ,4960 1,0000 ,5257( 302) ( 302) ( 302) ( 0) ( 302)

P= ,000 P= ,000 P= ,000 P= , P= ,000

NOTAMATE ,5576 ,6110 ,4626 ,5257 1,0000( 302) ( 302) ( 302) ( 302) ( 0)

P= ,000 P= ,000 P= ,000 P= ,000 P= ,

(Coefficient / (D.F.) / 2-tailed Significance)

" , " is printed if a coefficient cannot be computed

Interpretazioa aurreko taularenaren antzekoa da. Kasu honetan PUBPRIBA aldagaia kontrolatzean,emaitzak ez direla asko aldatzen ikusten dugu. Erlazio handiena gaztelania eta euskarako noten arteandago orain ere, baita matematika eta fisikako noten artean ere.

KONTUZ! Posible da zuk emaitza hauek berak baina ordena desberdinean lortzea. Korrelazio--koefizienteen kalkulua eskatzeko orduan, zuk adierazi diozun ordenaren arabera aurkezten dizkizu alda-gaiak SPSSWINek.

3.9. ERREGRESIOA

Aldagai ezberdinen artean erlaziorik badagoela jakitea, ikusi dugun bezala, oso garrantzitsua da eta kasuaskotan gure azterketaren helburuak guztiz beteak gera daitezke kalkulu honekin. Baina, sarritan, aurre-rapauso bat ematea interesatuko zaigu, eta orain azalduko dudana izan daiteke honetako bat. Aldagai batedo lortutako emaitzak ezagutu ondoren, aldagai bateko emaitzak iragartzeko saiakera egin nahi izangenezake.

Adibide erraz betekin ikus dezakegu hori. Pentsa dezagun Oñati, Arrasate eta Elorrioko ikasleen emai-tzak konparatzen ditudala. Logikoki nire herrikoak, Oñatikoak, Elorriokoak baina hobeak dira eta hauek,era berean, Arrasatekoak baina hobeak. Posible da nire azterketa hemen bukatzea, baina baita ere posi-ble da pertsona zehatz baten emaitza interesatzea, adibidez, Oñatikoa dela jakinik. Oñatiko guztiek osoemaitza onak lortu dituztela ondorioztatu bada, pertsona horren emaitza iragar dezaket. Baina Oñatikoikasleen artean ere denetik baldin badago, iragarpena jada, ez da hain erraza. Edo iragarpena egiteanerrore-maila handiagoa izan dezaket.

Bigarren adibide bat honako hau da: ikastola bateko andereñoak, badaki, edo behintzat iragar deza-ke, Gabonak aurretik bere gelako ikasleen kurtso-bukaerako eskola-errendimendua zein izango den.Andereño honek, mentalki, erregresio bat egin du. Ikasleen ezaugarri eta aldagai zehatzetan oinarrituz,kurtso-bukaeran hauen errendimendua zein izango den AURREIKUSTEN du. Noski! nahas daiteke, izanere, batzuetan nahasten da, baina iragarpen honek gure andereñori asko lagun diezaioke eskola-porrotairagartzen den kasuetan. Andereñori ez zaio axola bere iragarpenak izan dezakeen errore-maila (agianarduratu beharko litzateke), aldiz ikuspuntu estatistikotik begiratuta, errore-mailaren kalkulua ere oi-narrizkoa da.

Page 125: Estatistika teoria eta praktika SPSSWIN erabiliz

MENPEKO deritzon aldagai batean iragarpenak ASKE deritzen beste bat edo batzuen balioak ezagu-tuz egitea, erregresioaren helburua dela aipatu dugu. Baina, lan egiten ari garen maila edo errore-tarteaezin badugu zehaztu, ez dugu ezer egiten iragarpenak sortuz. Hauek, erregresioarekin aztertuko ditugunkorrelazio-kalkuluen bi alderdi osagarriak dira.

Aldagai aske batekin lan egiten dugunean, hau da aldagai bakar baten datuak erabiltzen baditugu ira-garpena egiteko, erregresio SINPLEAZ arituko gara, baina aldagai batzuen datuak erabiltzen baditut, erre-gresio ANIZKOITZAZ arituko gara.

Erregresio kontzeptua korrelazio-kontzeptuarekin estuki lotua dago. Aldagaien arteko erlazioa zenbateta handiagoa izan, hobeto erabili ahal izango ditut iragarpenak egiteko,... Iragarpenaren kalitatearenindize edo neurri bezala determinazio-koefizientea erabiliko dugu; hau korrelazio-koefizientearen berre-dura bezala definitu dugularik.

Erregresioaz hitz egitean, gure puntuen hodeira zuzen bat doitzen badugu erregresio linealaz ari gara,eta gure puntuen hodeira edozein motatako ekuazio bat doitzen dugunean, erregresio ez linealaz hitzegin dezakegu.

Erregresio metodoaz, sakonki 10. kapituluan jardungo badugu ere, atal honetan, azaletik bada ere,beronen kalkuluaren prozesua eta oinarrien aurkezpena egin nahi nuke.

3.9.1. Erregresio lineala: oinarriak eta kalkuluak

Erregresioaren analisia, korrelazio-printzipioaren bidez, menpeko aldagai batean beste aldagai askebatzuek dituzten efektuak eta efektu hauen magnitudeak ikasteko edo ikertzeko metodo bat da.

Korrelazio-koefizientea kalkulatzetik erregresio-ekuazioa kalkulatzera, oso salto koalitatibo handiadago. Korrelazioaren kasuan, honako hau aztertzen dugu: aldagaien artean ia harremanik badagoen alaez, eta harreman hau nola koantifikatu. Erregresioen kasuan, ostera, aldagai askeen aldaketak menpekoaldagaietan eragiten dituzten aldaketak aztertzen ditugu. Eta azkenik, erregresioaren funtsezko helburua,ezaguna den aldagai askearen bidez, menpeko aldagaien aurresana egitea izango da.

Esan beharra dago erregresioaz hitz egiteko, aldagaiek, koantitatiboak izan behar dutela.

Orain arte ez dugu aldagai aske eta menpekoez hitz egin. Menpeko aldagaia, aztertu nahi dugun alda-gaia izango da. Hau aztertzeko beste aldagai bat edo batzuk erabiliko ditugu: aldagai askeak izango dira.Aldagai askea bakarra denean ERREGRESIO SINPLEA dugu, eta aldagai askeak bat baino gehiago direne-an ERREGRESIO ANIZKOITZA.

Erregresioaren analisia ez da aldagaien arteko harremanak aztertzeko bakarrik erabiltzen, beste hirufuntsezko atal ere baditu:

.– Menpeko aldagai eta aldagai aske edo askeak hobeto erlazionatzen dituen funtzio matematikoa azter-tzea.

.– Aurreko puntuan aipatutako funtzioa ezagutu ondoren, funtzioaren parametroak kalkulatu, eta egin-dako doikuntza edo egokitzearen hurbiltasuna kalkulatzea.

.– Aldagai askearen datuak kontuan harturik, menpeko aldagaien aurresanak bete eta aurresan hauenbaliozkotasuna kalkulatzea.

Aipatutako lehenengo puntua ez dugu liburu honetan aztertuko, aurrez jarritako helburuak gainditzendituelako. Kasu guztietan, aldagaien arteko erlazioa lineala dela onartuko dugu. Beraz, erregresio linealsinplea bakarrik ikusiko dugu gai honetan.

113Estatistika deskribatzailea. 2 aldagai edo gehiago

Page 126: Estatistika teoria eta praktika SPSSWIN erabiliz

3.9.2. Erregresio lineal sinplea

Edozein zuzenen ekuazioa adierazteko modu bat hau da:

Y = a + b X

Gure arazoa hau izango da, gure datu-multzoari (Xi,Yi) gehien hurbiltzen zaion zuzenaren parame-troak kalkulatzea; hain zuzen, “a” eta “b” parametroen balioak kalkulatzea. Hurbiltze hau “karratu txi-kien” zentzuan hartuko dugu, hau da, gure zuzena ondoko baldintza betetzen duena izango da: puntue-tatik zuzenerako distantzien karratuen batura minimoa egiten duena. Beste era batera esanda, aurresane-ko erroreak minimoak egiten dituena. Zuzen honi, ERREGRESIO ZUZENA deituko diogu.

Azter dezagun adibide sinple hau. Bi aldagai hauek ditugu:

Xi: kurtso-hasieran egindako TEST batean, 10 ikaslek lortutako emaitzak.

Yi: ikasle horien kurtso-amaierako NOTAK.

Xi: TEST Yi: NOTAK

15 614 516 712 416 710 520 815 712 520 6

150 60

Lehen momentuan, aldagaien arteko erlazioa neurtuko digun korrelazio-koefizientea kalkulatukodugu, eta horretarako Pearsonen formula arrunta erabiliko dugu. Kalkuluak eginda lortutako emaitzekin,taula berri hau eraikiko dugu:

Xi Yi X2 Y2 Xi*Yi

15 6 225 36 9014 5 196 25 7016 7 256 49 11212 4 144 16 4816 7 256 49 11210 5 100 25 5020 8 400 64 16015 7 225 49 10512 5 144 25 6020 6 400 36 120

150 60 2346 374 927

Eta hemendik, Pearsonen korrelazio-koefizientea kalkulatzeko formula kontuan hartuta:

114

TEST

222018161412108

NO

TAK

9

8

7

6

5

4

3

Page 127: Estatistika teoria eta praktika SPSSWIN erabiliz

Lortuko dugun emaitza:

Beraz, badakigu aldagaien arteko erlazioa nahikoa handia dela, kalkulatu dugun korrelazio-koefi-zientea Rxy = 0.7364 delarik.

Baina, erregresioaren bitartez, kurtso-amaieran matematika-arloan ikasleak lortuko dituen notak aurre-sateko aukerak analizatzen saiatuko gara. Erregresio zuzenaren ekuazioak menpeko aldagaiaren balioaaurresaten lagunduko digu. Gure kasuan, kurtso-amaierako matematikako notak aldagai askeen arabera,hau da, testean lortutako puntuazioak kontuan hartuta egin beharko da.

Erregresio zuzenaren parametroak kalkulatzeko, ondoko formularen bidez egingo dugu:

Gure kasuan:

Aurreko kalkuluen bidez, datu-multzoei gehien hurbiltzen zaion zuzenaren ekuazioa, erregresio--zuzenen ekuazioa, hau da:

Y’ = 1’78125 + 0’28125 X

Erregresio-ekuazioa ezagutuz, menpeko aldagaien aurresanak erraz lortuko ditugu, hau da, pertsonabatek X aldagaian 10 puntu lortu baditu Y aldagairako egingo diogun aurresana ekuaziotik zuzenean lor-tuko dugu, X aldagaien tokian bere balioa jarriz.

Gure ekuazio honetan:

Y’=1’78125 + 0’28125 X ; X=10 bada Y’= 1’78125 + 0’28125 * 10

Eta hemendik, gure aurresana:

Y’ = 1’78125 + 2’8125 = 4’59375

a = Y bX = 6 0.28125* 15 = 1.78125− −

b =

927

10* 6

2346

10(15 )

=92.7 90

234.6 225=

2.7

9.6= 0.28125

2

15

a = Y b X−

Erregresio koefizient ea: b =

( X * Y )

nX * Y

Xn

( X )

i i

i2

2

∑−

∑−

x,y

2 2

r =

927

1015* 6

2346

10(15 ) *

374

10(6 )

=92.7 90

234.6 225 37.4 36= 0.7364

− −

− −

x,y

i i

i2

2 i2

2

r =

( X * Y )

nX *Y

Xn

( X ) * Yn

( Y )

∑−

∑−

∑−

115Estatistika deskribatzailea. 2 aldagai edo gehiago

Page 128: Estatistika teoria eta praktika SPSSWIN erabiliz

Hurrengo galdera berehala sortzen da: zenbateraino da baliagarria kasu honetan lortu dugun aurresa-na? Kontuan hartu behar da, estatistikan, edozein balioren estimazio edo aurresana egiterakoan estima-zioa bezain garrantzitsua dela estimazioen baliozkotasuna, edo beste era batera esanda, aurresana egite-rakoan egiten ari garen erroreari marjina edo muga jartzea. Azken batean, edozein estimazio edo infe-rentziak bere baliozkotasunen ezaugarriak eraman behar ditu.

Kasu honetan, hau da, erregresioa erabiltzen dugunean, aurresanaren baliozkotasuna kalkulatzeazuzenen bidez puntuarekiko lortutako hurbiltasuna kalkulatzea izango da, hau da, zenbat eta hurbiltasunhobea lortu, errore txikiagoa edukiko dugu eta gure aurresanen baliozkotasuna handiagoa izango da.

Lortutako hurbiltasuna kalkulatzeko, aztertuko ditugun distantziak edo diferentziak Y eta Y’-ren arte-koak izango dira, Y aldagaiaren balioak izanik eta Y’ pertsona horien aurresanak (beren X aldagaien balio-ak ikusiz lortutakoak). Distantzia hauek, erregresio zuzenaren bidez egin ditzaketen aurresanak, beneta-ko balioei asko ala gutxi hurbiltzen zaizkien ikusteko lagunduko digute. Gure kasuan, egingo nituzkeenaurresanen eta lortuko nituzkeen distantzien zutabeak egin ondoren, beste bi zutabe lortuko ditugu. Bat,aurrerago erabiltzeko, distantzien karratuekin osatua, eta azkena, laugarrena, Y2 aldagaien balioekin osa-tua.

Y’ = 1’78125 + 0’28125 X

Egiaztatu ahal izango dugunez Y’i-ko (aurresanak) puntuazioak ez dira bat etortzen behatutako Yrenpuntuazioekin. Bat etorriko dira aldagaien erlazioa orokorra denean bakarrik, hau da, korrelazio--koefizientea +1 edo -1 denean.

Daukagun errorea, AURRESANEN ERROREA edo AKATS TIPIKOA erabiliz kalkulatuko dugu. Argidago, aldagaien artean harremana zenbat eta handiagoa izan, korrelazio-koefizientea hainbat eta han-diagoa izango dela. Baina aldagaien artean harremana handiagoa bada, honek hau esan nahi du, Xi etaYi puntuak, zuzen batetik hurbilago egongo direla, hau da puntuak zuzen batera gehiago hurbiltzen dire-la. Honek, erregresio zuzenen bidez lortzen dudan hurbiltasuna handiagoa dela esan nahi du, hau da,errorea txikiagoa izango dela.

AURRESANEN ERRORE TIPIKOA, beraz, honela definituko dugu:

Eta gure kasuan:

See = dN

=6.40803

10= 0.80050i

2∑

Seed

Nnon d Y Y

i

i i i= = −∑ 2

'

116

Xi

15141612161020151220

150

Yi

6574758756

60

Y’í

36254916492564492536

374

Y’i = 1.78125 + 0.28125 X

6.000005.718756.281255.156256.281254.593757.406756.000005.156257.40675

di = Yi - Y’i

0.000000.718750.718751.156250.718750.406750.593751.000000.156251.40675

di

0.000000.516600.516601.336910.516600.165440.352531.000000.024411.97894

6.40803

Page 129: Estatistika teoria eta praktika SPSSWIN erabiliz

Askotan, ondoren aurkezten den beste formula hau ere erabiltzen da. Arrazoia hau da: bigarren for-mula honek propietate estatistiko hobeak dituela, baina arazo hau beste gai batean sakonduko dugu.

Lehen aipatu dugu korrelazio-koefizientea eta erregresio zuzena erabiliz egiten ditugun erroreen ar-tean badago zerikusirik. Bien arteko erlazioa ondoko formularen bidez adieraziko dugu:

S2ee––––– = 1 – R2xy (1)S2y

non: S2ee aurresanen errore tipikoen berreduraS2y Y aldagaien bariantzaR2xy korrelazio-koefizienteen berredura diren

Formula honetan korrelazio-koefizienteen berredura, DETERMINAZIO-KOEFIZIENTEA izendatua, etaaurresanen errore tipikoen arteko harremana azpimarratzea garrantzizkoa da.

R = +1 edo R = -1 bada, badakigu aldagaien arteko erlazioa totala edo orokorra dela, eta balio hauekgoiko formulan ordezkatuz honako hau lortuko dugula:

S2ee––––– = 1 – 1 = 0 ; hemendik zenbakitzailea: S2ee =0,S2y

Honek, korrelazio-koefizientea ± 1 baldin bada, erregresio zuzenen bidez lortzen dugun hurbiltasunaorokorra dela esaten digu, hau da, errorea 0 izango dela.

R = 0 bada, aldagaien artean ez dago inongo harremanik. Balio hau aurreko formulan ordezkatuz,honakoa lortuko dugu:

S2ee––––– = 1 – 1 = 0 ; hemendik zenbakitzailea: S2ee =S2yS2y

Eta honek erregresio zuzenak puntuarekiko lortzen duen hurbiltasuna zero dela esaten digu, zeren etaerrore karratuen balioa eta Y aldagaien bariantzak berdinak baitira.

374Gure adibidean S2y = ––––– – 62 = 37’4 – 36 = 1’4

10

S2ee = 0’64080

R2xy = 0’54228

Hemendik lortuko dugu:S2ee 0’64080

––––––– = –––––––– = 0’4577S2y 1’4

eta noski, balio hau eta 1–R2xy balioak berdinak dira. Lehengo formulak esaten zuen bezala, gure kasuan:1 – 0’54228 = 0’4577.

See = dN - 2

i2∑

117Estatistika deskribatzailea. 2 aldagai edo gehiago

1 Amaituko dugu esaten formula honek adierazten duen harremana ikusirik, korrelazio-koefizienteen berredura, DETER-MINAZIO KOEFIZIENTEA deitzen dena, eta honen interpretazioa era honetara defini dezakegu: Menpeko (Y) aldagaienbariantzaren portzentai zatia, X aldagaiak esplikatzen duena da. Gure kasuan esan dezakegu, kurtso-amaierako matema-tikako noten aldakortasunen % 54 esplikatzen duela kurtso hasieran pasatu dugun testean lortu duten puntuazioak.

Page 130: Estatistika teoria eta praktika SPSSWIN erabiliz

3.9.3. SPSSWINekin lortutako emaitzak

Emaitza hauek SPSSWINekin lortu nahi baditugu, behin programa kargatu ondoren, datu-fitxategi batireki behar dugu, non TEST eta NOTAK aldagaiak definitu ondoren, erregresio lineal sinpleko emaitzaklortzeko pausoak ematera joko dugun. Datuak tekleatzeko gogo gutxirekin baldin bazabiltza, hitzaurreanaipatutako Web orrialdeko REGLIN.SAV fitxategia kargatu, eta gero honako pausoak eman behar dituzu:

EstadísticosRegresión

Lineal

eta “dependiente”n NOTAK idatziko dut, “Independiente(s)”en TEST, gainerantzeko aukerak ukitu gabeutziko ditudan bitartean. Amaitzeko Aceptar sakatuko dut.

7.5 bertsioarekin lortutako emaitzak hauek dira:

SPSSWIN 7.5

Regresión

1,781 1,399 1,273 ,239

,281 ,091 ,736 3,079 ,015

(Constante)

TEST

Modelo1

B Error típ.

Coeficientes noestandarizados

Beta

Coeficientes

estandarizados

t Sig.

Coeficientesa

Variable dependiente: NOTAKa.

7,594 1 7,594 9,483 ,015a

6,406 8 ,801

14,000 9

RegresiónResidual

Total

Modelo1

Suma decuadrados gl

Mediacuadrática F Sig.

ANOVAb

Variables predictoras: (Constante), TESTa.

Variable dependiente: NOTAKb.

,736a ,542 ,485 ,8949Modelo1

RR

cuadrado

Rcuadradocorregida

Error típ.de la

estimación

Resumen del modelo

Variables predictoras: (Constante), TESTa.

TESTa

, IntroducirModelo1

Variablesintroducidas

Variableseliminadas Método

Variables introducidas/eliminadasb

Todas las variables solicitadas introducidasa.

Variable dependiente: NOTAKb.

118

Page 131: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitza berak, 6.1.3 bertsioarekin:

SPSSWIN 6.1.3

* * * * M U L T I P L E R E G R E S S I O N * * * *

Listwise Deletion of Missing Data

Equation Number 1 Dependent Variable.. NOTAK

Block Number 1. Method: Enter TEST

Variable(s) Entered on Step Number1.. TEST

Multiple R ,73649R Square ,54241Adjusted R Square ,48521Standard Error ,89486

Analysis of VarianceDF Sum of Squares Mean Square

Regression 1 7,59375 7,59375Residual 8 6,40625 ,80078

F = 9,48293 Signif F = ,0151

---------------------------------------------------------------- Variables in the Equation ---------------------------------------------------------

Variable B SE B Beta T Sig T

TEST ,281250 ,091332 ,736485 3,079 ,0151(Constant) 1,781250 1,398896 1,273 ,2387

End Block Number 1 All requested variables entered.

Emaitza hauetan oinarrizkoak azpimarratu ditut, gai honetan kalkulatu ditugunak.

Aztertu beharreko aldagai Menpekoa, (dependiente) iragarri beharrekoa, NOTAK dela eta Askea(Independiente), edo iragartzeko erabiliko duguna, TEST dela adierazi ondoren, emaitzak aurkezten has-ten da: lehenengoa, R Anizkoitza, korrelazio-koefizienteari dagokio, 73649. R Anizkoitza etiketa, oroko-rrean korrelazio anizkoitzeko koefizienteari egokituko zaiona, erregresio anizkoitzari dagokio menpekoaldagai askorekin lan egin behar dugunean, baina gure kasuan SINPLEari buruz da. Hala ere, SPSSWINekkoefizientearen etiketa ez duela aldatzen ikus dezakezu.

Ondoren R cuadrado/R Square-ren balioa aurkezten digu: .54241, eta DETERMINAZIO edo MUGA-TZE Koefizienteari dagokiona, lehen ere kalkulatu duguna. Koefiziente hau modu honetan interpretadezakegu: NOTAK aldagaian ematen diren % 54.24 aldaketa, TEST aldagaian ematen diren aldaketekazal edo esplika ditzakete. Aldagai askearen paralelo sortzen diren menpeko aldagaiaren aldaketen por-tzentaia da.

Gero R cuadrado corregido/Adjusted R Square aurkezten digu. Egile ezberdinek korrelazio-koefi-zientea, eta ondorioz determinazio-koefizientea, halabeharrez “puztua” dagoela adierazten du, zuzendubeharra aditzera emanaz. Bi balioen funtziopean, piskatxo bat gutxitu behar litzateke. Bi funtzio horiekdatu-kopurua eta lan egiten dugun aldagai-kopurua dira. Zuzenketa honen emaitza, atal honetan aur-kezten diguna, 48521 da.

Segidan Error típico de la estimación/Standard Error aurkezten digu: .89486, “See” izenarekin aur-keztu duguna. Datuak frogatuz joan nahi baduzu SPSSWINek lan egiten duen formula, aurkeztu dizkizu-danen artean bigarrena da:

119Estatistika deskribatzailea. 2 aldagai edo gehiago

Page 132: Estatistika teoria eta praktika SPSSWIN erabiliz

Ondoren erregresioaren emaitzak aurkezten dizkigu bariantzaren analisiaren eredutik (une honetangure helburuetatik at), azken zatian erregresio-ekuazioa beraren emaitzak aurkezteko. Variables in theequation (coeficientes) izenpean aurkezten dizkigu:

Hemen B-ren zutabean ekuazioa aurkezten digu:

Variable BTEST .281250(Constant) 1.781250

Erregresio-ekuazioa da hau, lehen esan bezala, behin testean puntuazioa ezagutu ondoren ikaslebaten notei buruzko iragarpena egiten utziko diguna. Horrela, ikasle batek testean 14 puntu lortu bazi-tuen, puntuazio hau iragarriko genioke:

NOTA = 1.78125 + .281250*TEST = 1.78125 + .281250*25 = 5.71875

Iragarpen honek ez digu ezertarako balio, bere onargarritasun-indizerik ez badugu. Indize bezala,oraingoz, determinazio doituko koefizientea erabiliko dugu: R cuadrado corregida/Adjusted R Square:.48521. Honek aldagai askearen aldakortasunaren % 48.52 bakarrik kontrolatu dugula adierazten digu.Hau da, oraindik ere zergatik gertatzen den ez dakigun aldagaiaren aldaketen % 51.48 badago. Honekkontrolik gabeko zatia oso handia dela adierazten digu, eta era berean, modu honetako iragarpena egi-tean dudan arriskua ikaragarria dela aditzera ematen digu.

Iragarpenaren kalitatearen ideia bat egiteko banakako puntuazio bakoitzaren eta erregresio zuzenarenarteko distantzian fija gaitezke; iragarpenen errore-tarteen kalkuluaren gainean oinarritzen diren distan-tziak (diferentziak) dira. Metodo honen posibilitateak gehituz goazen eran, prozesua hobetu egingo da.(11. gaia).

See = dN - 2

i2∑

120

TEST222018161412108

NOTAK

9

8

7

6

5

4

3

erregresio zuzena: y’ = 1.78125 + 0.28125

Page 133: Estatistika teoria eta praktika SPSSWIN erabiliz

3.10. ARIKETAK: KORRELAZIOA

1. 25 itemekin osatutako froga bat pasatu diegu ikastola bateko 14 ikasleri hauen arrazonamendu abs-traktua neurtzeko; emaitzak ondoko taulan X izeneko zutabean ikusiko dituzu. Bestalde, matemati-kako errendimendua neurtzeko, 25 itemekin osatutako beste froga bat ere pasatu diegu. Emaitzakondorengo taulan Y zutabean dituzu.

X Y

20 25

20 22

19 14

18 24

23 23

18 14

13 18

14 18

18 20

17 14

19 20

19 22

16 14

21 24

ΣXi = 255 ΣYi = 272

ΣX2 = 4735 ΣY2 = 5506

ΣXi Yi = 5029

a) Kalkula itzazu aldagai bakoitzaren batezbestekoa, mediana eta desbideratze tipikoa.

b) Zein eratako formula erabiliko duzu aldagaien arteko erlazioa aztertzeko? Zergatik? Formula horierabiliz kalkula ezazu aldagaien arteko erlazioa neurtzeko baliagarria den indizea.

2. OHOko 7. eta 8. mailako matematikako noten arteko erlazioa aztertu nahian ondoko taula eraikidugu. Kalkula ezazu bi kurtsoko noten arteko erlazioa, komeni den formula erabiliz.

OHOko 7. maila

gainditu ez gainditu

OHOko 8.maila gainditu 40 10

EZ gainditu 5 30

3. Hitz-jario eta sexuaren arteko erlazio aztertu nahian gabiltza une honetan, eta horretarako ondorenaurkezten diren datuak lortu ditugu. Kalkula ezazu bi aldagaien arteko erlazioa neurtuko duen koe-fizientea.

X Y

Hitz-jarioa Emakumeak Gizonak

21-22 1 2

19-20 2 1

17-18 3 2

15-16 1 3

13-14 2 1

11-12 1 5

121Estatistika deskribatzailea. 2 aldagai edo gehiago

Page 134: Estatistika teoria eta praktika SPSSWIN erabiliz

4. Fakultate ezberdinetako ikasle batzuei Selektibitateko azterketari buruzko iritzia galdetu diegu, etaondorengo taulan agertzen diren emaitzak lortu ditugu. Kalkula ezazu aldagaien (Fakultatea eta iri-tzia) arteko erlazioa neurtzeko baliagarria den indize bat.

Zuzenbidea Informatika Psikologia Hezkuntza

Alde 320 250 510 45

Aurka 500 150 520 200

Ez daki/ ez du erantzun 200 50 210 35

5. Irakasle batek, OHOko 7. mailako matematikako notak erabili nahi ditu, 8. mailako matematikakonoten aurresana egiteko. Horretarako aldagai bien ezaugarri batzuk kalkulatu ditu, eta hauek izandira emaitzak:

a) Zein da 8. mailako matematikako noten aurresana egiteko erabiliko dugun erregresio zuzenarenekuazioa? Zein da a eta b balioen esanahia?

b) Patxik, 7. mailan, matematikako notan 8 puntu atera zituen. Zein izango da 8. mailako matema-tikako notari buruz egingo diogun aurresana?

d) Zenbaterainoko baliozkotasuna dauka aurreko puntuan egin dugun aurresanak?

6. OHOko bigarren zikloko 30 ikasleri ahozko ulermena neurtzen duen froga bat pasa diegu, eta frogahonetan lortu ditugun emaitzak, Lengoaiako notarekin eta sexuarekin ia harremanik ba ote duenaztertu nahi dugu. Horretarako, ondorengo taula eraiki dugu. Kalkula ezazu hiru aldagaien artekoerlazioak neurtuko dituen koefizientea, kasu bakoitzean komeni den formula erabiliz.

Zenbakia X Y SEXUA

1 25 8 G2 30 7 E3 16 8 G4 18 6 E5 09 2 G6 17 3 G7 35 5 G8 38 9 E9 40 10 G

10 50 10 E11 46 8 E12 16 6 E13 38 7 G14 27 6 G15 20 4 E16 48 8 E17 12 6 E18 9 4 G19 38 9 G20 40 8 E21 26 6 G22 12 6 E23 29 3 G24 32 5 G25 36 7 E26 42 6 E27 15 2 G28 22 3 E29 17 4 G30 38 7 G

X = 7 Sx = 1.5 Y = 5 Sy = 1.7 r = 0.52xy

122

Page 135: Estatistika teoria eta praktika SPSSWIN erabiliz

7. EHUn eginiko eskola-errendimenduari buruzko ikerketa bateko 1.450 ikasletik 675 “letretakoak”dira eta gainerakoak “zientzietakoak”. Errendimendua GAI edo EZ GAI bezala neurtzen baldin bada,eta Letretakoen artetik 243 ikaslek gainditzen badute, gainditutakoen kopuru osoa 854koa da.Karrera-mota eta errendimenduaren arteko erlazioa zehaz ezazu.

8. Ikastetxe bateko orientatzaileak ikasleen helbideei buruzko informazioa, hiru leku ezberdinetan sail-katua (X,Y,Z), eta gurasoen ikasketa-moten informazioa jaso du (O: oinarrizkoak, E: ertainak, G: goi--mailakoak). Lortutako emaitzak ondorengoak izanik, azter ezazu ikasleen helbide eta gurasoenikasketa-mailaren artean dagoen erlazioa:

X Y Z

Oinarrizkoak 60 80 40

Ertainak 40 100 60

Goi-mailakoak 20 120 10

9. Haur-hezkuntzako andereño batek ikasleen eskola-orduetako nekea ikasle hauek gosaritan egitenduten elikadura-motarekin erlazionatua dagoela pentsatzen du. Baieztapen hau indartuko duten fro-gak emateko, andereñok bere 18 ikaslek neke-sintomak azaltzen hasten diren ordena errejistratu etabehatu du, modu honetan lehenengoa aurrena nekatzen dena da, 2.a nekea azaltzen duen bigarre-na da eta horrela elkarren segidan. Gero, bakoitzaren gosariko kaloria-kopuruaren azterketa bateginda, ondorengo taula lortu ahal izan dugu. Jasotako emaitzak kontuan izanik, azter ezazu bi alda-gaien artean dagoen erlazioa:

Nekea 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18.

Kilokaloriak .75 .65 .58 .56 .47 .63 .63 .66 .71 .53 .65 .66 .73 .59 .75 .78 .67 .79

10. Gela batean hauteskundeak egin dira ikasleen ordezkaria hautatzeko. Horretarako bi bozketa egindira, gehien bozkatutako hautesleak hauek izanik, lortutako botuen arabera. Emaitzak ikusi ondo-ren, bi bozketen arteko konkordantzia-maila muga ezazu.

1. Aldia 2. Aldia

Beñat Amaia E.

Maider Ainhoa

Amaia E. Beñat

Amaia A. Maider

Ainhoa Nerea

Elena Elena

Nerea Amaia A.

Nikolas Saioa

Saioa Tamara

TamarA Nikolas

123Estatistika deskribatzailea. 2 aldagai edo gehiago

Page 136: Estatistika teoria eta praktika SPSSWIN erabiliz

11. Ikastola bateko ikasleen gurasoak kezkatuta daude, beraien gela bigarren solairuan duten ikasleenartean istripu gehiago ematen baita gela lehenengo solairuan dutenen artean baino. Hau dela eta,beren kezkak argitzeko azterketa bat egiten dute eta bertan, gela kokatzen den solairua eta zorizhautatutako 68 ikaslek (solairu bakoitzeko 34) istripurik izan duten ala ez hartzen da kontuan.Emaitzen taula honakoa bada, azter ezazu ea zerikusirik baduen gela kokatzen den solairuak etaistripua izateak edo ez izateak.

Istripuak

EZ BAI

Kokapena: Goian 28 6

(solairua)

Behean 32 2

124

Page 137: Estatistika teoria eta praktika SPSSWIN erabiliz

4. PROBABLITATEA ETA PROBABILITATE-BANAKETA

4.1. PROBABILITATEAREN DEFINIZIOAK

4.2. PROBABILITATEAREN PROPIETATEAK

4.2.1. Probabilitate totalaren teorema

4.3. BAYES-EN TEOREMA

4.4. ALDAGAI ALEATORIOAK

4.5. BANAKETA DISKRETUAK

4.5.1. Bernouilliren banaketa

4.5.2. Banaketa binomiala

4.5.3. Pascalen banaketa

4.5.4. Poissonen banaketa

4.6. ARIKETAK

Page 138: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 139: Estatistika teoria eta praktika SPSSWIN erabiliz

127

4. PROBABILITATEA ETA PROBABILITATE-BANAKETAK

Kalean askotan entzuten dira honelako esaerak: “Irabazteko probabilitatea oso handia da”, “Bihar, men-dira joateko probabilitaterik ez dut izango”.

Esaera hauek erabiltzen ditugunean, gure buruan daukagun ideiak bat egiten du, matematika- edoteoria-mailan, probabilitateari buruz erabiltzen denarekin.

Hala ere probabilitatearen kontzeptu estatistikoa sistematizatu beharra dago.

Probabilitate-kontzeptuaz hitz egin baino lehen, gertaera eta saiakuntza aleatorioari buruz hitz eginbeharra dago.

Demagun dado bat airera botatzen dugula. Guk ez dakigu begi-bistan zein aurpegi geratuko den,baina badakigu seietakoren bat agertuko dela: puntu bat, bi puntu,..., edo sei puntukoa. Hau da saiakun-tza aleatorio baten lehenengo garrantzizko propietatea: aukera posibleak ezagunak dira. Zein gertatukoden ez dakigu.

Bigarrena, aleatorioa edo zorizkoa izatea da. Honek ez du esan nahi aukera guztien probabilitateakberdinak direnik, baizik eta zoriak parte hartzen duela emaitza bat lortzerakoan. Saiakuntza bera bi aldizegiten badugu, ez da derrigorrezkoa emaitza berdina lortzea. Beste era batera esanda guk ezin dugu era-baki zein emaitza lortuko dugun.

Hauek dira edozein esperimentu edo saiakuntza aleatoriok bete behar dituen baldintzak.

Azpimarratu beharra dago aleatorio eta zorizko hitzek estatistikan esangura bera dutela.

Saiakuntza aleatorio bati lotuta GERTAERA ALEATORIOAK daude. Gertaera, edozein saiakuntzatan lorlitekeen edozein emaitza posible izango da.

Hurrengo kontzeptu berria LAGIN-ESPAZIOA izango da. Lagin-espazioa saiakuntza aleatorio batekoemaitza guztiek osatzen duten multzoa da. Hau da, edozein gertaera, lagin-espazioaren azpimultzo batbezala kontsideratu ahal izango dugu. Dado bat airera botatzean, gertaeretako bat zenbaki bikoitia ate-ratzea izango da, seikoa ateratzea beste gertaeretako bat izango da, eta, noski, biak lagin-espazioarenazpimultzoak izango dira, zeren eta kasu honetan lagin-espazioa ondoko hau da: {1,2,3,4,5,6}. (Esanbeharrik ez dago honen guztiaren atzetik multzo-teoria dagoela, baina guk hemen azaletik bakarrik iku-tuko dugunez ez gara teoria honetan murgilduko).

Gertaera aleatorioak definitu ondoren, hauen sailkapena egingo dugu. Sailkapen honek probabilitate-aren kalkuluarekin zerikusia du, eta honek garrantzitsu bilakatzen du gaia.

.– GERTAERA SEGURUA: Gertaera bat segurua izango da lagin-espazioarekin bat datorrenean. Hau da,gertaera hori emango dela segurua denean. Gertatu behar duena beti gertatuko da.

.– GERTAERA EZINEZKOA: Gertaera seguruaren kontrakoa da, ez da posible gertaera hau inoiz buru-tzea; inoiz ez da gertatuko.

.– GERTAERA BATERAEZINAK: Izenak berak dioen bezala, bi gertaera bateraezinak izango dira, biakbatera gerta ezin daitezkeenean. Lehenengoa gertatzen bada, bigarrena ezin da gertatu. Adibidez,dado bat airera botatzean, 1 zenbakia lortzea eta 2 zenbakia lortzea, biak izatera lortzea, baterazinaizango da.

.– GERTAERA BATERAGARRIAK: Bi gertaera bateragarri izan daitezen, baldintza bakarra bete behardute: biak batera gertatzeko posibilitatea izatea. Hau da, dado bat airera botatzean, zenbaki bikoitiaeta 4a baino txikiagoa lortzea posible izango da; hau betetzen duten bi gertaera hauek bateragarriizango dira.

Page 140: Estatistika teoria eta praktika SPSSWIN erabiliz

.– KONTRAKO GERTAERAK: Bi gertaera kontrakoak direla esango da, bien artean gertaera segurua osa-tzen dutenean. Adibidez, dado bat airera botatzean zenbaki bikoitia lortzea eta zenbaki bakoitia lor-tzea kontrako gertaerak izango dira.

Kontuan eduki behar da, kontrako gertaerak bateraezinak ere izan litezkeela, baina gertaera baterae-zinak ez direla beti kontrakoak izango.

.– GERTAERA ASKEAK: Bi gertaerak aske izateko bete behar duten baldintza hau da: bien artean ez dagoinongo harremanik. Adibidez, bi dado airera botatzen baditugu, lehenengo eta bigarren dadoko emai-tzen artean ez dago erlaziorik. Beste adibide bat: karta-pilo batetik karta bat ateratzen badugu, urreaizatea eta irudia izatea, gertaera askeak dira. Kasu honetan bi gertaera hauek, bere artean, ez dute zeri-kusirik, zeren eta gure karta urrea izan edo ez izan, beste gertaeraren probabilitatea (irudia izatekoa-rena) ez baita aldatzen.

.– MENPEKO GERTAERAK: Bi gertaera menpekoak izango dira, lehenengo gertaerak bigarrenarena bal-dintzatzen badu. Hau da, dado bat airera botatzen badugu eta lehenengo gertaera 3 edo 3 baino txi-kiagoa izatea eta bigarrena parea izatea baldin bada, lehenengo gertaera betetzen bada, bigarrena bal-dintzatua geratzen da. Karten kasuan, lehenengo gertaera irudia izatea eta bigarrena 5 edo handiagoaizatea baldin badira, bi gertaera hauek, bere artean, menpekoak izango dira. Lehenengoa gertatzenbada (irudia bada), bigarrena ere gertatuko da (5 edo zenbaki handiagoa izango da), eta alderantziz,5 edo handiagoa dela jakiteak irudia izateko probabilitatea handitu egingo du; honela, 1, 2, 3 edo 4zenbakiko kartak multzotik baztertu egingo ditugulako.

4.1. PROBABILITATEAREN DEFINIZIOAK

Probabilitate-kontzeptua definitzean, aplikazio-alorren arabera, bi era ezberdinetan erabiliko dugu.

Lehenengoak, probabilitatearen definizio klasiko deiturikoa, hau dio: Gertaera baten probabilitateaaldeko kasu eta kasu posibleen arteko proportzioan datza. Hau da A gertaeren probabilitatea honeladefinituko dugu:

Aldeko kasuakP(A) = ––––––––––––––––

Kasu posibleak

Adibidez karta-pilotik urre bat ateratzeko probabilitatea ondoko hau izango da:

Aldeko kasuak 10P(A) = –––––––––––––– = –––––

Kasu posibleak 40

Batzuetan, probabilitate-definizio hau, planteamendu batzuk argitzeko ez da nahikoa izango.Adibidez, Zein da kalean topatzen dugun lehenengo pertsonak gabardina eramateko dagoen probabilita-tea? galdetzen badigute, argi eta garbi dago kasu posibleen kopurua zenbatzea ez dela posible, ezta alde-ko kasuen kopurua ezagutzea ere.

Bigarren definizioa, edo probabilitate estatistikoaren definizioa, aurreko arazoa argitzeko baliagarriaizango zaigu (non, teorikoki, lagin-espazioa imajinaezina edota infinitoa izan daitekeen). Probabilita-tearen bigarren definizio honek, bere sorrera maiztasun erlatiboen kontzeptuan dauka. Probabilitatehauek (probabilitate enpirikoak ere deituak) momentura arte behatutako gertaerak etorkizunean iraungoduenaren baldintzan oinarritzen dira.

128

Page 141: Estatistika teoria eta praktika SPSSWIN erabiliz

4.2. PROBABILITATEAREN PROPIETATEAK

0 < P(A) < 1

Probabilitatea, edozein kasutan 0 eta 1 balioen tartean kokatzen da. Gertaera baten probabilitatea 0izango da EZINEZKO gertaera denean, hots, aldeko kasuen kopurua 0 denean. Gertaera baten probabili-tatea 1 izango da gertaera SEGURUA denean, hots, aldeko kasuen kopurua eta kasu posibleena berdinakdirenean.

GERTAEREN EBAKETA: PROPIETATEAK. A eta B gertaerak aldi berean agertzeko dagoen probabilitateakalkulatzerakoan 3 kasu ezberdin aztertu beharko ditugu:

1) Gertaera bateraezinak badira, aldi berean gerta ezin direnez, A eta B gertaeren ebakiduren probabili-tatea 0 izango da.

2) Gertaera askeak badira, hau da, bat gertatzeak ez du bestea gertatzean eraginik, gertaeren ebakidurenprobabilitatea A eta B gertaeren probabilitateen biderkadura izango da.

P (A eta B) = P (A ∩ B) = P (A) * P (B)

Adibidez, karta-pilotik bat atera eta urrezko irudia izateko probabilitatea kalkulatu nahi badugu, bigertaeren ebakiduren probabilitatea kalkulatu nahi dugu. Kasu honetan gertaera biak hauek izangodira: A, Urrea izatea eta B, Irudia izatea. Problema hau bi era ezberdinetan erabaki dezakegu:

a) zuzenean aldeko kasuak zenbat diren kalkulatuz.

3 aldeko kasu 3P (urrezko irudia) = –––––––––––––– = ––––––

40 kasu posible 40

b) aipatutako formula erabiliz.12 10 120 3

P (urrezko irudia) = P (irudia) * P (urrea) = –––– * –––– = –––– = ––––40 40 1600 40

3) Menpeko gertaerak badira, hau da, bat gertatzeak bestea gertatzearekin zerikusia badauka, ebakidu-ren probabilitatea ondoko hau izango da: Lehenengo gertaeraren probabilitatea bider bigarren gerta-era gertatzeko dagoen probabilitate baldintzatua, lehenengo gertaera gertatua dela badakigularik.

P (A eta B) = P (A ∩ B) = P (A) * P (B/A)

P (B/A) rekin zera ulertu behar da: A gertaera gertatu dela jakinik, B gertaera gertatzeko dagoen pro-babilitatea.

Ikus ditzagun aipatutako formularen esanahia eta erabilera adibide bat jarriz. Demagun karta-pilotikbi karta elkarren segidan ateratzen ditugula, lehenengoa karta-pilora bueltatu gabe. Lehenengo kartaurrea eta bigarrena kopa izateko probabilitatea kalkulatu nahi badugu, honela jokatuko dugu:

P (1.a urrea eta 2.a kopa) = P (1.a urrea) * P (2.a kopa / 1.a urrea)=

10 10 100= ––––– * ––––– = –––––

40 39 1560

Atera dugun lehenengo karta urrea izan bada eta bueltatu ez dugunez, bigarrena ateratzerakoan 39karta dauzkagu piloan, eta haietatik 10 kopak direla kontuan hartu behar dugu (lehenengoa urrea delasuposatzen baitugu).

Aurreko esperimentu bera egin nahi badugu, baina bigarren karta ere urrea izanik, probabilitateahonela kalkulatuko dugu:

129Probabilitatea eta probabilitate-banaketak

Page 142: Estatistika teoria eta praktika SPSSWIN erabiliz

P (1.a urrea eta 2.a urrea) = P (1.a urrea) * P (2.a urrea / 1.a urrea)=

10 10 90= ––––– * ––––– = –––––

40 39 1560

Kasu honetan, lehenengo karta urrea izanik bigarren karta urrea izateko probabilitatea 9/39koa izan-go da, 39 karta gelditzen baitira eta haietatik 9 dira urreak, lehenengo karta ere urrea izan baita.

GERTAEREN BILKETAREN PROBABILITATEA: A edo B gertaeren probabilitatea ondoko hau izangoda: bi gertaeren probabilitatearen batuketa ken gertaeren ebaketaren probabilitatea. Beraz bi gertae-retatik, gutxienez bat gertatzeko probabilitatea hau izango da: gertaera bakoitzaren probabilitatearenbatuketa ken bi gertaerak aldi berean gertatzeko probabilitatea.

P (A edo B) = P (A ∪ B) = P (A) + P (B) – P (A ∩ B)

Adibidez, karten kasuan, ateratzen dugun karta urrea edo irudidun karta izateko probabilitatea kalku-latu nahi badugu:

P (urrea edo irudia) = P (urrea) + P (irudia) - P (urrea eta irudia)

10 12 3 19P (urrea edo irudia) = –––– + –––– – –––– = ––––

40 40 40 40

OHARRA: Batzuetan probabilitatea kalkulatzeko, gure karta-piloan aipatzen diren baldintza edo bal-dintzak betetzen dituzten kartak zenbat diren kontatzea formulak erabiltzea baino errazago izango da.

4.2.1. Probabilitate totalaren teorema

Demagun bi kutxa dauzkagula: K1 eta K2. Lehenengoan, K1ean, 8 txartel zuri eta 2 beltz dauzkagu etaK2an 4 txartel zuri eta 4 beltz.

Proposatzen den problema honako hau da: kutxa batetik txartel bat ateratzen dugu, zein kutxatatikatera dugun jakin gabe, eta kalkulatu txartel hau zuria izateko dagoen probabilitatea.

Era honetako probabilitateak kalkulatzeko egingo dugun planteamendua ondokoa izango da: bi alter-natiba egon daitezke atera dugun txartela zuria izan dadin.

a) K1 kutxa aukeratzea. Kasu honetan probabilitatea 8/10 litzateke.

b) K2 kutxa aukeratzea. Kasu honetan probabilitatea 4/8 litzateke.

Beraz, ondorengo planteamendu hau egin dezakegu.

Txartel zuria bi eratara lor dezakegu:

K1 kutxa aukeratu eta txartel zuria aterata

edo

K2 kutxa aukeratu eta txartel zuria aterata

130

Page 143: Estatistika teoria eta praktika SPSSWIN erabiliz

P (txartel zuria) = P (K1 eta txartel zuria) + P (K2 eta txartel zuria)

1 8 8 P (K1 eta txartel zuria) = P(K1) * P(txartel zuria / K1) = –––– * –––– = ––––

2 10 20

1 4 4 P (K2 eta txartel zuria) = P(K2) * P(txartel zuria / K2) = –––– * –––– = ––––

2 8 16

Hemendik, honako probabilitatea lortuko dugu:

8 4 208 52P (txartel zuria) = –––– + –––– = –––– = ––––

20 16 320 80

Orokorrean, probabilitate totalaren teoremak esaten diguna hauxe da: B1, B2, B3,..... eta Bk gertaerakbadauzkagu, non hauen batura gertaera segurua den, eta bi edozein gertaeraren ebakidura hutsa baldinbada, hots, batak bestea baztertzen badu, A gertaeraren probabilitatea honela kalkula dezakegu:

P(A) = P (A ∩ B1 ) + P (A ∩ B2 ) + ........... + P (A ∩ Bk )

Ikus dezagun orain bigarren egoera bat.

Pentsa dezagun, bilera batean bilbotarrak eta donostiarrak ditugula. Lautik bat, % 25, bilbotarra da.Bestalde, Bilboko kutsaduraren ondorioz, bilbotarren % 70ek arnasketa-arazoak ditu. Donostiarren arte-an, berriz, arnasketa-arazoak % 10ak baino ez du.

Plantea genezakeen lehen galdera hau da: Guk, zoriz, pertsona bat hautatzen badugu, zenbatekoa dapertsona hau bilbotarra izateko probabilitatea? Galdera honen erantzuna oso erraza da; probabilitatehonen zenbatekoa 0.25ekoa da, gure taldean % 25 baitira bilbotarrak.

Bigarren galdera bat ere plantea dezakegu: Zoriz pertsona bat hautatzen badugu, pertsona honekarnasketa-arazoak izateko probabilitatea zenbatekoa da?

Erantzuna jada, ez da hain erraza. Zeren arabera dago emaitza? Donostiarra edo bilbotarra izatearenarabera. Bilbotarra bada donostiarrak baino probabilitate handiagoa du arnasketa-arazoak izateko.

Galdera horri zehaztasunez erantzuteko, arnasketa-arazoak zenbatek dituzten kalkulatu beharkodugu. Bilbotarren % 70 eta donostiarren % 10 direla badakigu, baina gure taldean bilbotarrak donostia-rrak baino gutxiago dira. Nola konponduko dugu arazo hau?

Oso erraz!!!

Bilbotarren % 70ek arnasketa-arazoak dituztela badakigu, hau da guztien % 25aren % 70ak (% 25bakarrik baita bilbotarra). Eta donostiarren % 10ak ere bai, hau da % 75eko % 10ak (donostiarrak % 75baitira).

Eta zenbat dira hauek guztiak?

% 25aren (bilbotarren) % 70a = 0.70 * 0.25 = 0.175, eta (donostiarren) % 75aren % 10a = 0.10 * 0.75= 0.075

Beraz, guztira, arnasketa-arazoak dituzten pertsonen kopurua:

0.175 + 0.075 = 0.25 (% 25ek arnasketa-arazoak ditu)

131Probabilitatea eta probabilitate-banaketak

Page 144: Estatistika teoria eta praktika SPSSWIN erabiliz

Modu berean, arnasketa-arazorik gabeko pertsonen kopurua kalkula genezake. Bilbotarren % 30 etadonostiarren % 90 izango dira. Hau da, (bilbotarren) % 25aren % 30 eta (donostiarren) % 75aren % 90.Guztira:

0.30 * 0.25 = 0.075 eta0.90 * 0.75 = 0.675

Arnasketa-arazorik gabeko pertsonak guztira:

0.075 + 0.675 = 0.75 (% 75ek ez du arnasketa-arazorik)

Logikoki, arnasketa-arazoak dituztenen eta ez dituztenen arteko batura % 100 da.

Orain, aurreko biak nahastuko dituen hirugarren galdera bat planteatuko dugu. Arnasketa-arazo naba-riak dituen pertsona batekin topo egin dut. Bilbotarra izateko probabilitatea zenbatekoa da?

Bilbotarrek arnasketa-arazo gehiago dituzte baina gutxiago dira, donostiarrek arazo gutxiago dituztebaina gehiago dira. Nola nahastuko ditugu kontzeptu biak?

Bayesen teorema aplikatu aurretik, sarrera bikoitzeko ondorengo taula eraikitzea egokia izaten da, ber-tan bilbotar edota donostiar izatea eta arnasketa-arazoak izatearen portzentaia edo probabilitatearekinkonbinatzen dugularik.

Taula honetako balioak betetzea oso erraza da. Badakigu zenbat diren bilbotarrak eta zenbat donos-tiarrak (% 25 eta % 75, hurrenez hurren). Arazoak dituztenen (% 25) eta arazorik gabekoen (% 75) kopu-ru osoak ere oraintxe kalkulatu ditugu.

Laukiak ere osa ditzakegu, donostiarren % 10ek (totalaren % 7.5) eta bilbotarren % 70ek (totalaren% 17.5) arnasketa-arazoak dituela bai baitakigu. Ondorengo taula osatuko dugu, bada:

Arnasketa- Arnasketa-

-arazoekin -arazorik gabe

BILBOTARRAK 0.175 0.075 0.25

DONOSTIARRAK 0.075 0.675 0.75

GUZTIRA 0.25 0.75 1

Behin taula osatu ondoren, gogora dezagun zein galdera erantzuten ari garen: Arnasketa-arazoakdituen pertsona batekin topo egin dut. Bilbotarra izateko probabilitatea zenbatekoa da?

Orain errazago daukagu. Arazoak dituela dakidanez, lehenengo zutabean egongo da, arnasketa--arazoak dituztenen % 25aren artean. Kasu posibleak, jada, ez dira taldeko guztiak, lehen zutabekoakbakarrik baizik. Eta aldeko kasuak, bilbotarra izatea eta arnasketa-arazoak edukitzea, hau agerikoa delaesaten baitidate, 0.175ekoa (% 17,5) da.

Beraz, eskatutako probabilitatea hau izango da:

Aldeko kasuak 0.175P(A) =–––––––––––––––– = ––––– = 0.7

Kasu posibleak 0.25

Ondorioz, talde honetan zoriz pertsona bat hautatzen badugu, bilbotarra izateko probabilitatea% 25ekoa da, baina arnasketa-arazoak dituela baldin badakit, probabilitatea % 70era igotzen da.

132

Page 145: Estatistika teoria eta praktika SPSSWIN erabiliz

4.3.- BAYES-EN TEOREMA

Aurreko arazoa konpontzeko, lagin-espazioa bi zatitan deskonposatu dugu, donostiarrak eta bilbota-rrak, (B1 eta B2), kasu honetan ez baitugu beste inongo pertsonarik.

Kasu hauetan, erlazioa duten bi aldagai nahasten direnean, edo bietako baten gertaerak edo gertaera-rik ezak bestearen gertaera edo gertaerarik eza baldintzatzen duenean, Bayesen teoremaren formulakplanteatutako arazoa zuzenean konpontzen digu.

Formula ondorengo hau da:

P(B1) * P(A/B1)P(B1/A) = ––––––––––––––––––––––––––––– (1)

P (B1)*P (A/B1) + P (B2)*P (A/B2)

Formula honetan P(B1/A) idazten dugunean, A gertatu dela eta B1 gertaeraren probabilitatea adieraz-ten dugu. Beste era batera esanda, A pasa dela jakinik, B1 ere gerta daitekeela (A behean dago) irakurribehar dugu. Aldiz P(A/B1), B1 dela jakinik, A ere gerta daitekeela irakurri beharko dugu. Kasu honetanB1 gertatu da, edo ikusi dut, eta A gertatzeko dagoen probabilitatea jakin nahi dut.

Lagin-espazioa “k” gertaeraren B1, B2, B3,...BK osagarritan deskonposatzen dugunean, eta gertaerahauek beraien artean bateraezinak direnean, Bayesen teorema beste formula honen bidez aplikatukodugu:

P (B1) * P (A/B1)P (B1/A) =––––––––––––––––––––––––––––––––––––––––––––––––––––

P (B1) * P (A/B1) + P (B2) * P (A/B2)+.....+ P (Bk) * P (A/Bk)

Gure kasuan, honen probabilitatea kalkulatu nahi izanik, gertakizuna horrela idatz genezake:

P (bilbotarra/arnasketa-arazoak)

Gure arazoa, Bayesen (1) formula erabiliz aska dezakegu B1 agertzen den tokian, bilbotarra idatzikodugu, B2, donostiarra, eta A agertzen den tokian, arazoak izatea. P(A/B1), “Bilbotarra izanik arnasketaarazoak izateko probabilitatea”, eta P(A/B2), “Donostiarra izanik arazoak izateko probabilitatea”. Beraz,formula honela geratzen zaigu:

P(Bilbotarra) * P(arazoak/Bilbotarra) P (Bilb/arazoak) =–––––––––––––––––––––––––––––––––––––––––––––––––––

P(Bilb) * P(arazoak/Bilb) + P(Donos) * P(arazoak/Donos)

0’25 * 0’70 0’175 0’175P(Bilb/arazoak) = –––––––––––––––––– = ––––––––––––– = –––––––– = 0’70

0’25*0’70 + 0’75*0’10 0’175+0’075 0’25

Sarrera bikoitzeko taularekin lortu dugun emaitza berera iritxi gara, baina Bayesen formula erabiliz.

Beste kasu bat

Imajina dezagun ondorengo egoera hau. EAE-ko Ikastoletako 1.000 ikaslek osatutako talde bat dugu.Ikasle hauek hizkuntz ereduen arabera modu honetan banatzen dira: % 45 D ereduan, % 30 B ereduaneta % 25 A ereduan. Era berean eredu bakoitzean publiko eta pribatuen sailkapena horrela da: D ereduan% 70 publikoa eta % 30 pribatua, B ereduan % 50 eta % 50, eta A ereduan, % 20 ikastetxe publikoaneta % 80 pribatuan. Datu hauetatik abiatuz, ikus dezagun nola osa litekeen sarrera bikoitzeko hurrengotaula.

133Probabilitatea eta probabilitate-banaketak

Page 146: Estatistika teoria eta praktika SPSSWIN erabiliz

Garbi dago B ereduko ikasleen % 30 ikastetxe publiko eta pribatuetan banatuko ditugula, erdi eta erdi,hau da % 15 bakoitzarentzat (0.30*0.50), D eredukoak, % 30 pribatura doaz, hau da, % 45aren % 30,honek totalaren % 13.5 ematen digu, eta horrela taula osatu arte.

Laukietako balioak osatu ondoren, ikastetxe pribatuetara doazen ikasleen kopurua, lehenengo ilarakolaukietako probabilitateak batzearen emaitza izango da. Eta publikora doazenen kopurua, bigarren ilara-ko probabilitateak batzearena.

Hau horrela da, ikastetxe pribatu batera joateko probabilitatea hiru gertaeretan deskonposa dezake-gula baiezta daitekeelako: pribatu eta D eredura joan, pribatu eta B eredura joan, edo pribatu eta A ere-dura joan. Modu berean, ikastetxe publiko batera joateko probabilitatea hiru gertaeren arabera deskon-posa dezakegu: A, B eta D ereduetara.

D eredua B eredua A eredua

Pribatuak 0.135 0.15 0.20 0.485

Publikoak 0.315 0.15 0.05 0.515

Guztira 0.45 0.30 0.25 1.000

Behin taula eratu ondoren, plantea genitzazkeen galdera-motak hauek dira:

1.- Zein da ikastetxe publiko batera joateko probabilitatea? Galdera honek erantzun zuzena du: 0.515

2.- Zein da D eredura joateko probabilitatea? Hemen ere, erantzuna zuzena da: 0.45

3.- Zein da B eredura, baina ikastetxe pribatura joateko probabilitatea? Hemen ere zuzena da: 0.15.

4.- Ikaslea B eredura doala jakinik, kalkulatu ikastetxe pribatura joateko probabilitatea. Kasu honetan, Bereduko ikasleetatik erdia ikastetxe pribatuetara eta beste erdia publikoetara doala badakigu. Beraz,eskatutako probabilitatea 0.50 da.

5.- Ikaslea ikastetxe publikora doala jakinik, A eredura joateko probabilitatea kalkulatu. Kasu honetan gal-dera honela eralda dezakegu: ikaslea beheko lerroetako (ikastetxe publiko batera doala esaten didate-lako) aukeretako (laukietako) batean dagoela jakinik, A ereduko zutabean egoteko probabilitatea kal-kulatu.

Hemen, kasu posibleak 0.515 dira (lerro bereko probabilitateen batura). Eta aldeko kasuak 0.05; horre-la, eskatutako probabilitatea hau izango da:

0.05p = –––––– = 0.097

0.515

Bosgarren galdera hau Bayesen teoremaren bitartez askatzeko, hiru aukeretarako (hiru eredu: A, B, D)formula honakoa da:

P(B1) * P(A/B1)P(B1/A) =––––––––––––––––––––––––––––––––––––––––––––

P(B1)*P(A/B1) + P(B2)*P(A/B2) + P(B3)*P(A/B3)

Gure kasuan eskatutako probabilitatea hau da: P (A/publikoa), eta formula garatzen badugu, hauxeizango da:

P(A) * P(publikoa/A)P(A/publikoa) =–––––––––––––––––––––––––––––––––––––––––––––––––––

P(A)*P(publiko/A) + P(B)*P(publiko/B) + P(D)*P(publiko/D)

134

Page 147: Estatistika teoria eta praktika SPSSWIN erabiliz

Eta emaitza hau da:

0.25 * 0.20 0.05P(A/publikoa) =–––––––––––––––––––––––––––––––––––– = ––––––––– = 0.097

0.25 * 0.20 + 0.30 * 0.50 + 0.45 * 0.70 0.515

4.4. ALDAGAI ALEATORIOAK

Esperimentu aleatorio bat definitzen dugunean, bi gauzaz hitz egiten ari gara. Alde batetik, gerta daitez-keen gertaerak zeintzuk diren eta, bestetik, gertaera hauen probabilitateaz.

Dado bat airera botatzen badugu, badakigu sei aldeetatik bat irtengo dela eta alde bakoitzak irtetekoduen probabilitatea 1/6 dela.

Beste kasu bat ikusten badugu, adibidez txanpon bat airera botatzen dugunean, badakigu kurutx edopil irtengo zaigula eta kasu bakoitzaren probabilitatea 1/2 izango dela.

Aldagai aleatorioaren definizio klasikoa hau da: “Aldagai aleatorioa, esperimentu aleatorio batenemaitzen unibertso posiblean definituriko funtzio erreal bat da”. Definizio hau, honela esplika dezakegu:esperimentu aleatorio bateko gertakizun posibleei balio bat esleitu behar diegu eta beraien probabilitateaere adierazi beharko dugu.

Balio-multzoari eta beraien probabilitatei aldagaien dentsitate-funtzio edo probabilitate-funtzio dei-tzen zaio. Lehen aipatu ditugun bi adibideetan, bi aldagai aleatorio hauek defini ditzakegu:

Txanpon bat botatzen dugunean

Gertaera Balioa Probabilitatea

Pil 1 p = 0.50

Kurutx 0 q = 0.50

Dadoa botatzen dugunean

Gertaera Balioa Probabilitatea

1 atera 1 1/6

2 atera 2 1/6

3 atera 3 1/6

4 atera 4 1/6

5 atera 5 1/6

6 atera 6 1/6

Dadoaren kasuan gertaera bakoitzari bere aldean azaltzen den puntuen zenbakia jarri diegu.Txanponaren kasuan, pil ateratzeari 1 balioa eta kurutx ateratzeari 0 balioa eman diogu.

Aldagai aleatorioak DISKRETU eta JARRAIETAN sailka daitezke. Aldagai aleatorio baten balioak zen-baki osoen bidez adierazi daitezkeenean DISKRETUA izango da, zeren eta ondoz ondoko balioen arteanezin da erdiko baliorik eduki. Lehen aipatu ditugun bi aldagaiak, diskretuak izango dira.

Aldagai aleatorio JARRAI batean ezin da elkarren segidako balioez hitz egin. Hau da, edozein baliohartzen dugula, ez da posible izango balio honen hurrengoez hitz egiterik. Adibidez gure aldagaia per-

135Probabilitatea eta probabilitate-banaketak

Page 148: Estatistika teoria eta praktika SPSSWIN erabiliz

tsonen pisua bada, ezin genezake jakin 50 kg-ren hurrengo balioa zein den, 50en hurrengo bezala edo-zein balio aukeratzen dugula ere, bien artean infinitu balio egongo baitira.

1.- ITXAROPEN MATEMATIKOA ETA ALDAGAI ALEATORIO BATEN BARIANTZA

Demagun ondoko aukera egin behar dugula: 10 pezeta irabaztea % 100 kasuetan, 100 pezeta irabaztea% 50 kasuetan, edo, azkenik, 1.000 pezeta irabaztea % 10 kasuetan. Denetatik bat bakarrik aukeratze-rakotan zein eta zergatik aukeratuko genuke? Planteamendu egokia edo zuzena hau izango litzateke:Luzarora zein aukerarekin lortuko nuke etekin handiena?

Demagun esperimentua 100 aldiz errepikatzen dugula eta kalkula ditzagun kasu bakoitzean lortukogenituzkeen etekinak.

a) % 100eko kasuetan 10 pezeta irabaziz = 10*100 = 1.000 pzta.

b) % 50eko kasuetan 100 pezeta irabaziz = 100*50 = 5.000 pzta.

d) % 10eko kasuetan 1.000 pezeta irabaziz = 1.000*10 = 10.000 pzta.

Kalkulu hauek ikusi ondoren, bidezkoa da hirugarren aukeraren alde egotea.

Antzeko adibidea izan daiteke ondorengo hau ere. Pentsa dezagun lagun batekin dadoka jolasean arigarela, aurrez erregela hauek jarri ondoren: 100 pezeta irabaziko ditut 6a ateratzen denean, 50 pezetairabaziko ditut 5a irtetean eta 30 pezeta galduko ditut ateratzen den balioa 5a baino txikiagoa bada.

X aldagai aleatorioa, nire ekonomiak jokaldi bakoitzean jasaten dituen aldaketa bezala definitzenbadugu, honela geratuko litzateke:

Xi Pi

100 1/6

50 1/6

–30 4/6

300 jokaldi egiten baditugu, hau gertatzea espero dugu: 100 pezeta irabaziko ditut 1/6 aldietan, 50pezeta irabaziko ditut 1/6 aldietan eta 30 pezeta galduko ditut 4/6 aldietan. 300 jokaldi hauetan nire eko-nomiarekin gertatuko dena era honetakoa izango da:

Totala = 100*1/6*300 + 50*1/6*300 – 30*4/6*300 = 1.500

Totala = 5.000 + 2.500 – 6.000 = 1.500

300 jokaldi hauek bukatu ondoren 1.500 pezeta irabaztea espero dut. Baiezta dezakegu, 300 jokaldihauetan, jokaldi bakoitzean, batezbeste, 1.500/300 = 5 pezeta irabaziko ditudala ere.

Adibide honetan aldagai baten “ITXAROPEN MATEMATIKOA” izena duen parametroen kalkuluakegin ditugu. Ondorioz, edozein aldagairen itxaropen matematikoa kalkulatzeko posibilitatea eskainikodizkigun formulak definituko ditugu.

Aldagaia diskretua bada:

E (x) = ∑∑ Xi * f (Xi) = ∑∑ Xi * P (Xi)

Aldagaia jarraia bada:

E(x) = ∫∫ x * f(x) dx

136

Page 149: Estatistika teoria eta praktika SPSSWIN erabiliz

Bigarren formula honetan, aldagai jarraien kasuko formula idatzi dugu, baina kalkuluak egiterakoan,kalkuluak integralekin egitea beharrezkoa izango da, eta gai honetako helburuak gainditzen dituenez,hemendik aurrera, gure kalkuluetan aldagai diskretuetara mugatuko gara.

Beraz, honela definitutako X aldagaia badugu:

X : 0 1 2 3f(X): .2 .3 .4 .1

Aldagai honen itxaropen matematikoa hau izango da:

E(X) = 0 * .2 + 1 * .3 + 2 * .4 + 3 * .1 = 1.4

Azken finean ITXAROPEN MATEMATIKOA eta lagineko batezbesteko matematikoak berdin daitezke,batean eta bestean kalkuluak egiteko aukera ematen duten formulak baliokideak baitira. Hau ikustekoaurreko adibidea beste era honetara jarriko dugu.

Pentsa dezagun 10 pertsonaz osaturiko lagin bat daukagula, 0, 1, 2, eta 3 balioak har ditzaketenak.Lortu dugun maiztasunen banaketa hau baldin bada:

Xi mi mi Xi mr

0 2 0 0.2

1 3 3 0.3

2 4 8 0.4

3 1 3 0.1

10 14 1

Azaldu dugun maiztasunen banaketa eta lehen azaldutako probabilitate edo dentsitate-funtzioarekinbat datozela ohar gaitezke. Eskuineko zutabeari begiratzen badiogu, aldagai honen maiztasun erlatiboaketa aurreko adibideko probabilitateak berdinak direla konturatuko gara. Lehenengo kasuko itxaropenmatematikoek eta bigarren kasuko batezbestekoek balio berdinak dauzkatela ere ikus dezakegu.

Estatistika deskribatzilearen gaian ikusten genuen bezala, aldagai aleatorioen kasuan ere zentralizazio-eta sakabanatze-neurriak ikusiko ditugu.

Bariantza eta desbideratze tipikoa definitu beharko ditugu.

Desbideratze tipikoa, kasu honetan ere, bariantzaren erro karratu bezala definituko dugu.

Aldagai aleatorio baten bariantza era honetara definituko dugu:

Bar (X) = E(X2) – E2(X) = E [(X - E(X))2]

Ikus dezagun aurreko formulan adierazitako kalkuluak nola egiten diren. Horretarako E(X2) kalkulatubeharra dugu, eta hau ondorengo formularen bidez egingo dugu:

E(X2) = Σ x2i * f(xi) = Σ x2i * p (xi)

Gure kasuan, lehen era honetara definitu dugun aldagaiarekin jarraitzen badugu:

X : 0 1 2 3f(X): .2 .3 .4 .1

E(X2) = Σ x2i * f(xi)= 02 * .2 + 12 * .3 + 22 * .4 + 32 * .1=

= 0 * .2 + 1 * .3 + 4 * .4 + 9 * .1 = 2.8

137Probabilitatea eta probabilitate-banaketak

_ ∑mi Xi 14X = –––––––– = ––––– = 1.4

∑mi 10

Page 150: Estatistika teoria eta praktika SPSSWIN erabiliz

E(X2) balioa kalkulatu ondoren eta X aldagaien itxaropen matematikoa 1.4 dela kontuan harturik,bariantzaren formulan balio hauek ordezkatzen ditugu:

Bar (X) = E(X2) – E2 (X) =2.8 – 1.42 = 2.8 - 1.96 = 0.84

Desbideratze tipikoa edo estandarra, bariantzaren erro karratua denez gero, gure kasuan:

Desbideratze tipikoa: s = √-.8-4 = .9165

Beraz, lanari ekiterakoan hurrengo pausoak kontuan hartu beharrekoak izango dira: lehenengo alda-gaien probabilitatea edo dentsitate-funtzioa ezagutu, gero aldagaien batezbestekoa eta bariantza kalkula-tu eta azkenik interesatzen zaigun probabilitatea kalkulatu.

Hala ere, bizitza errealean planteatzen zaigun egoera edo arazo konkretu batzuei probabilitateen teo-ria aplikatzen diegunean, dentsitate- edo probabilitate-funtzio berri bat aurkitzea ez da beti beharrezkoaizango, zeren eta, sarritan, gure egoerek aurretik aztertuta dauzkagun beste egoera ezberdin bat edobatzuekin harreman handia edukiko baitute.

Egoera edo alderdi asko errepikatzen direlako, edo gutxienez hauen ezaugarriak era berdinekoak izan-go direlako, BANAKETA TEORIKO batzuk definitu izan dira. Banaketa teoriko hauek aztertu nahi direnegoera tipikoetara egokituta daude. Banaketa teoriko edo probabilitate-eredu batzuk aztertuko ditugu,giza zientziei aplikatuta dagoen Estatistikan garrantzi handia baitute. Kasu askotan guri plantea dakizki-gukeen arazoei irtenbide bat emango diete banaketa teorikoek.

Probabilitateen banaketa teorikoak bitan banatuko ditugu:

.– BANAKETA DISKRETUAK

.– BANAKETA JARRAIAK

Gai honetan diskretuak, eta hauen artean, garrantzitsuena den Banaketa Normala aztertuko ditugu.Hurrengorako utziko ditugu jarraiak.

4.5. BANAKETA DISKRETUAK

4.5.1. Bernouilliren banaketa

Demagun txanpon bat airera botatzen dugula; hau esperimentu estatistiko bezala kontsideratzen badugu,bi emaitza posible lor ditzakegula ikus dezakegu, kurutx edo pil lortzea, alegia.

Edozein ikerlanetan, honelako egoeran oso maiz aurkitzen gara, esaterako, edozein aldagai dikoto-mikorekin ari garenean: sexua, pertsona batek galdera bati erantzun egokia eman dion ala ez,....

Normalean aldagai dikotomiko hauei 1 eta 0 balioak emango dizkiegu eta era honetako esperimen-tuei Bernouilliren esperimentua deritzogu. Esperimentu hau ondo definitzeko, bi emaitza posibleen pro-babilitateek ezagunak izan behar dute.

Aurreko kasuarekin jarraituz, txanponaren pil ateratzen denean arrakasta duen ekintza baten aurreangaude. Normalean edozein aldagai dikotomikoren aurrean gaudenean, emaitza bati arrakastaren trata-mendua emango diogu eta besteari, porrotarena. Aldagai dikotomiko bat era honetara definituko dugu:

0 pX

1 q = 1 – p

Aldagaiak 0 eta 1 balioak hartuko ditu, hauen probabilitateak p eta q izanik. Bi probabilitate hauenbatura beti 1 izango da (p+q = 1).

138

Page 151: Estatistika teoria eta praktika SPSSWIN erabiliz

Aldagai batetik bestera aldatuko dena probabilitateen balioa izango da, hau da p eta q balioak, zerenBernouilliren banaketako edozein esperimentutako eskema beti berdina baita.

4.5.2. Banaketa binomiala

Demagun txanpon bat hamar aldiz airera botatzen dugula edo test bat pasatzen dugula, non ikasleak 20galdera erantzun behar dituen, eta galdera bakoitzak 2 alternatiba dituen. Aurreko bi probatanBernouilliren esperimentuak erabiliko dira.

Demagun bi probabilitate hauek interesatzen zaizkigula: hamar aldiz botatako txanponean 6 pil lor-tzeko dagoen probabilitatea, edo ikasle batek 20 galderak zoriz erantzunda 12 galdera ondo erantzutekodagoen probabilitatea.

Bernouilliren N esperimentu errepikatzen ditugunean eta k arrakasta lortzeko dagoen probabilitateakalkulatu nahi badugu, lehengo bi galderetan bezala, BANAKETA BINOMIALEKO eredu teoriko batenprobabilitateak lortzen arituko gara.

Banaketa batek, BINOMIALA bezala kontsideratua izateko, bi baldintza hauek bete beharko ditu:

.– Bernouilliren esperimentuko N errepikapen egiten dira.

.– Arrakasta lortzeko dagoen probabilitateak prozesu guztian konstantea izan behar du.

Demagun lehen planteatu dugun galdera erabakitzen ari garela. 10 aldiz bota dugu txanpona aireraeta 6 aldiz pil ateratzeko dagoen probabilitatea kalkulatu nahi dugu. Txanpon trukatu hau airera botatzendugun bakoitzean pil lortzeko dagoen probabilitatea, lehen esan dugunez, 0.4 da.

Kasu honetako probabilitatea jakiteko, demagun pil 6 aldiz jarraian atera zaigula lehenengo 6 jaurti-ketetan; eta gero lau kurutx, hau da era honetara erori da gure txanpona: p p p p p p k k k k. Aurrekosaila ateratzeko dagoen probabilitatea hau da:

0.6*0.6*0.6*0.6*0.6*0.6*0.4*0.4*0.4*0.4 = 0.00119439

Baina kalkulatu dugun probabilitatea aurreko seriearen probabilitatea izango da, eta ez guk eskatzendugun probabilitatea, zeren eta 6 pil beste edozein ordenatan lor ditzakegu. Orain erantzun behar dugungaldera hau da: gure 6 pil zenbat posizio ezberdinetan atera daitekeen. Honen erantzuna KONBINATO-RIAK ematen du era honetara: agertzeko era ezberdinak kalkulatzeko nahikoa da 10 elementuen konbi-nazioak seinaka harturik kalkulatzea. Hemendik gure probabilitatea kalkulatzeko, lehen lortu dugunprobabilitatea bider konbinazio ezberdin posibleen kopurua egitea nahikoa izango da, aurreko seriea edobeste edozein konbinazio lortzeko probabilitatea konstantea delako. Adibidez (p p p k k k p p k p) seriealortzeko probabilitatea kalkulatu nahi badut, ondoko hau izango da:

0.6*0.6*0.6*0.4*0.4*0.4*0.6*0.6*0.4*0.6 = 0.00119439

hemendik, 6 pil lortzeko probabilitatea :

C10,6 :10 elementuen konbinaketak seinaka harturik,

eta honen balioa:

10*9*8*7*6*5*4*3*2*1 C10,6 = ––––––––––––––––––––––– = 210

6*5*4*3*2*1 * 4*3*2*1

P(sei pil) = C10,6 * 0.00119439 = 0.2508

139Probabilitatea eta probabilitate-banaketak

Page 152: Estatistika teoria eta praktika SPSSWIN erabiliz

Baina kalkulatzeko prozesua nahikoa neketsua da, batez ere bigarren adibidean aurkeztu dugun beza-lako probabilitate nahaspilatuagoak kalkulatu nahiko bagenitu, zeren 20 galderari erantzutean gutxienezhorietako 12ri igartzeko probabilitatea kalkulatu nahi badugu, 12, 13,... eta 20ri igartzeko probabilitate-ak kalkulatu beharko baikenituzke.

Hemen aipatu dugun adibidea edo antzerakoak askotan errepikatzen dira, eta gure probabilitateenkalkuluak errazteko taula batzuk eginda daude, non gure kasuko probabilitateak agertzen diren. Hurrengoorrialdeetan ikus daitezke banaketa binomialen taulak. Taula hauek begiratzeko hiru parametro hartubeharko dira kontuan: N, p, eta k. Parametro bakoitzaren esanahia orain ikusiko dugu:

N: Bernouilliren esperimentua errepikatu dugun aldi-kopurua adierazten du. Gure txanpona airerabotatzen dugunean N=10 izango da, eta testen kasuan N=20.

p: Bernouilliren esperimentu bakoitzean arrakasta lortzeko dagoen probabilitatea. Gogoratu beharradago, esperimentu osoan arrakasta lortzeko dagoen probabilitateak konstantea izan behar duela.

k: Probabilitatea kalkulatu nahi dudaneko gertaeraren arrakasta-kopurua.

Banaketa binomialen itxaropen matematikoa edo batezbestekoen balioa N*p izango da, eta bariantzaN *p* (1-p). Beti bezala desbideratze tipikoa bariantzaren erro karratua izango da.

Demagun lehen aipatu dugun probabilitatea kalkulatu nahi dugula: galdera bakoitzak bi aukera edu-kiz, 20 galderako test batean, zoriz erantzunda, gutxienez 12 ondo egoteko dagoen probabilitatea.

Jakina da item bakoitza igartzeko dagoen probabilitatea p=0.5 dela. Bernouilliren esperimentua erre-pikatzen dugun aldi-kopurua n=20 da, zeren gure testak 20 galdera baititu. Banaketa binomialen para-metroak definitzeko, k-ren balioa ezagutu behar da.

Gure nahia 12 galdera igartzeko probabilitatea kalkulatzea balitz, kasu honetan k-ren balioa 12 izan-go litzateke, eta probabilitatea lortzeko modua hau izango litzateke: tauletan, N=20, P=.50 eta K=12 ipin-tzea eta hemen aurkitzen dugun probabilitatea .1201 izango da.

Gure kasuan, gutxienez 12 arrakasta lortzeko probabilitatea kalkulatzeko, baliagarriak diren k-renbalioak K=12,13,14... izango dira eta hauei dagokien probabilitateen batura izango da kalkulatzen arigaren probabilitatea.

Hau da, gure kasuan batu behar ditugun probabilitateak hauek dira:

.1201 .0739 .0370 .0148 .0046 .0011 .0002 .0000 .0000

Eta emaitza hau izango da:P (gutxienez 12 arrakasta) = 0.2517

Ondorengo orrialdeetan azaltzen diren tauletan, p=0.50 edo txikiagoari dagozkionak probabilitateakdira, baina hasiera batean agertutako gertakizun edo antzerakoak sor daitezke, hau da, arrakasta lortze-ko probabilitatea 0.50 baino handiagoa izatea (p > 0.50), kasu hauetan hurrengo ariketetan bezala joka-tuko dugu.

Demagun gure txanpona airera botatzean, pil lortzeko probabilitatea 0.60 dela.

Probabilitate hau kalkulatzeko tauletara jotzen badugu, ez dugu p=.60ko zutaberik aurkituko, etahorregatik, arrakasta, kurutx ateratzeari deituko diogu.

140

Page 153: Estatistika teoria eta praktika SPSSWIN erabiliz

6 pil ateratzeko probabilitatea kalkulatu nahi dugu, baina 6 pil ateratzea eta 4 kurutx ateratzea, txan-pona 10 aldiz airera botatzean gertaera berdinak direla kontuan harturik, hauen probabilitateak berdinakizango dira eta kurutx ateratzeko probabilitatea, aldi bakoitzean .40 denez, gure gertaeren probabilitatea,n=10en blokean, .4ren zutabean eta k=4ren lerroan aurkituko dugu, eta lortuko dugun emaitza .2508 da.

Egin dugun aldaketa hau da:

P(10 jaurtialditan 6 pil ateratzea) = P(10 jaurtialdetan 4 kurutx ateratzea)

Bukatzeko, 10 aldiz txanpona airera bota eta pil lortzeko probabilitatea .60 dela jakinik, bi pil bainogehiago lortzeko dagoen probabilitatea kalkulatuko dugu.

Kasu honetan lehengoaren antzera, kurutx-en probabilitatea kalkulatuko dugu. Berdintasuna honelalortuko dugu:

Bi pil baino gehiago lortzea: 3, 4, 5,... 10 pil lortzea da, eta pil-kopuru hau lortzea eta 7, 6, 5,...edo 0kurutx lortzea gauza berdinak dira. Beraz probabilitate hau kalkulatzeko k-ren 7, 6, 5,...eta 0 balioeidagokien probabilitateak batu beharko ditugu, hau da, probabilitate hauen batura izango da gure emai-tza:

.0425 .1115 .2007 .2508 .2150 .1209 .0403 .0060

Probabilitate hauek N=10en blokean, eta p=.40ko zutabean bilatuko ditugu.

Aurreko probabilitateen batura = 0.9877 da, hau da, gure galderaren emaitza .9877 izango da.

Batzuetan errazago izango da kontrako gertaerara pasatzea, eta 7, 6, 5, 4, 3, 2, 1, edo 0 kurutx atera-tzeko kontrako gertaera, 8, 9 edo 10 kurutx ateratzea izango da. Eta kontrako gertaeren probabilitatea 1- gertaeren probabilitatea dela kontuan harturik, gure probabilitatea honela kalkula dezakegu.

P(7 kurutx edo gutxiago) = 1 - .0106 - .0016 - .0001 = 1 - .0123 = .9877

Bigarren era hau, askotan, askoz ere errazagoa da. Probabilitateek propietate hau betetzen baitute:probabilitate guztien baturak 1 izan behar du eta, ondorioz, gertaera baten probabilitatea eta kontrakogertaeren probabilitatearen batura beti 1 izango da.

141Probabilitatea eta probabilitate-banaketak

Page 154: Estatistika teoria eta praktika SPSSWIN erabiliz

BANAKETA BINOMIALEN TAULA (1)

N k .05 .10 .15 .20 .25 .30 .35 .40 .45 .50

1 0 .9500 .9000 .8500 .8000 .7500 .7000 .6500 .6000 .5500 .5000

1 .0500 .1000 .1500 .2000 .2500 .3000 .3500 .4000 .4500 .5000

2 0 .9025 .8100 .7225 .6400 .5625 .4900 .4225 .3600 .3025 .2500

1 .0950 .1800 .2550 .3200 .3750 .4200 .4550 4800 .4950 .5000

2 .0025 .0100 .0225 .0400 .0625 .0900 .1225 .1600 .2025 .2500

3 0 .8574 .7290 .6141 .5120 .4219 .3430 .2746 .2160 .1664 .1250

1 .1354 .2430 .3251 .3840 .4219 .4410 .4436 .4320 .4084 .3750

2 .0071 .0270 .0574 .0960 .1406 .1890 .2389 .2880 .3341 .3750

3 .0001 .0010 .0034 .0080 .0156 .0270 .0429 .0040 .0911 .1250

4 0 .8145 .6561 .5220 .4096 .3164 .2401 .1785 .1296 .0915 .0625

1 .1715 .2916 .3685 .4096 .4219 .4116 .3840 .3456 .2995 .2500

2 .0135 .0486 .0975 .1536 .2109 .2646 .3105 .3456 .3675 .3750

3 .0005 .0036 .0115 .0256 .0469 .0756 .1115 .1536 .2005 .2500

4 .0000 .0001 .0005 .0016 .0039 .0081 .0150 .0256 .0410 .0625

5 0 .7738 .5905 .4437 .3277 .2373 .1681 .1160 .0778 .0503 .0312

1 .2036 .3280 .3915 .4096 .3955 .3602 .3124 .2592 .2059 .1562

2 .0214 .0729 .1382 .2048 .2637 .3087 .3364 .3456 .3369 .3125

3 .0011 .0081 .0244 .0512 .0879 .1323 .1811 .2304 .2757 .3125

4 .0000 .0004 .0022 .0064 .0146 .0284 .488 .0768 .1128 .1562

5 .0000 .0000 .0001 .0003 .0010 .0024 .0053 .0102 .0185 .0312

6 0 .7351 .5314 .3771 .2621 .1780 .1176 .0754 .0467 .0277 .0156

1 .2321 .3543 .3993 .3932 .3560 .3025 .2437 .1866 .1359 .0938

2 .0305 .0984 .1762 .2458 .2966 .3241 .3280 .3110 .2780 .2344

3 .0021 .0146 .0415 .0819 1318 .1852 .2355 .2765 .3032 .3125

4 .0001 .0012 .0055 .0154 .0330 .0595 .0951 .1382 .1861 .2344

5 .0000 .0001 .0004 .0015 .0044 .0102 .0205 .0369 .0609 .0938

6 .0000 .0000 .0000 .0001 .0002 .0007 .0018 .0041 .0083 .0156

7 0 .6983 .4783 .3206 .2097 .1335 .0824 .0490 .0280 .0152 .0078

1 .2573 .3720 .3960 .3670 .3115 .2471 .1848 .1306 .0872 .0547

2 .0406 .1240 .2097 .2753 .3115 .3177 .2985 .2613 .2140 .1641

3 .0036 .0230 .0617 .1147 .1730 .2269 .2679 .2903 .2918 .2734

4 .0002 .0026 .0109 .0287 .0577 .0972 .1442 .1935 .2388 .2734

5 .0000 .0002 .0012 .0043 .0115 .0250 .0466 .0774 .1172 .1641

6 .0000 .0000 .0001 .0004 .0013 .0036 .0084 .0172 .0320 .0547

7 .0000 .0000 .0000 .0000 .0001 .0002 .0006 .0016 .0037 .0078

8 0 .6634 .4305 .2725 .1678 .1001 .0576 .0319 .0168 .0084 .0039

1 .2793 .3826 .3847 .3355 .2760 .1977 .1373 .0896 .0548 .0312

2 .0515 .1488 .2476 .2936 .3115 .2965 .2587 .2090 .1569 .1094

3 .0054 .0331 .0839 .1468 .2076 .2541 .2786 .2787 .2568 .2188

4 .0004 .0046 .0185 .0459 .0865 .1361 .1875 .2322 .2627 .2734

5 .0000 .0004 .0026 .0092 .0231 .0467 .808 .1239 .1719 .2188

6 .0000 .0000 .0002 .0011 .0038 .0100 .0217 .0413 .0703 .1094

7 .0000 .0000 .0000 .0001 .0004 .0012 .0033 .0079 .0164 .0312

8 .0000 .0000 .0000 .0000 .0000 .0001 .0002 .0007 .0017 .0039

142

Page 155: Estatistika teoria eta praktika SPSSWIN erabiliz

BANAKETA BINOMIALEN TAULA (2)

N k .05 .10 .15 .20 .25 .30 .35 .40 .45 .50

9 0 .6302 .3874 .2316 .1342 .0751 .0404 .0277 .0101 .0046 .0020

1 .2985 .3874 .3679 .3020 .2253 .1556 .1004 .0605 .0339 .0176

2 .0629 .1722 .2597 .3020 .3003 .2668 .2162 .1612 .1110 .0703

3 .0077 .0446 .1069 .1762 .2336 .2668 .2716 .2508 .2119 .1641

4 .0006 .0074 .0283 .0661 .1168 .1715 .2194 .2508 .2600 .2461

5 .0000 .0008 .0050 .0165 .0389 .0735 .1181 .1672 .2128 .2461

6 .0000 .0001 .0006 .0028 .0087 .0210 .0424 .0743 .1160 .1641

7 .0000 .0000 .0000 .0003 .0012 .0039 .0098 .0212 .0407 .0703

8 .0000 .0000 .0000 .0000 .0001 .0004 .0013 .0035 .0083 .0176

9 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0003 .0008 .0020

10 0 .5987 .3487 .1969 .1074 .0563 .0282 .0135 .0060 .0025 .0010

1 .3151 .3874 .3474 .2684 .1877 .1211 .0725 .0403 .0207 .0098

2 .0746 .1937 .2759 .3020 .2816 .2335 .1757 .1209 .0763 .0439

3 .0105 .0574 .1298 .2013 .2503 .2668 .2522 .2150 .1665 .1172

4 .0010 .0112 .0401 .0881 .1460 .2001 .2377 .2508 .2384 .2051

5 .0001 .0015 .0085 .0264 .0584 .1029 .1536 .2007 .2340 .2461

6 .0000 .0001 .0012 .0055 .0162 .0368 .0689 .1115 .1596 .2051

7 .0000 .0000 .0001 .0008 .0031 .0090 .0212 .0425 .0746 .1172

8 .0000 .0000 .0000 .0001 .0004 .0014 .0043 .0106 .0229 .0439

9 .0000 .0000 .0000 .0000 .0000 .0001 .0005 .0016 .0042 .0098

10 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0003 .0010

11 0 .5688 .3138 .1673 .0859 .0422 .0198 .0088 .0036 .0014 .0005

1 .3293 .3835 .2348 .2362 .1549 .0932 .0518 .0266 .0125 .0054

2 .0867 .2131 .2866 .2953 .2581 .1998 .1395 .0887 .0513 .0269

3 .0137 .0710 .1517 .2215 .2581 .2568 .2254 .1774 .1259 .0806

4 .0014 .0158 .0536 .1107 .1721 .2201 .2428 .2365 .2060 .1611

5 .0001 .0025 .0132 .0388 .0803 .1231 .1830 .2207 .2360 .2256

6 .0000 .0003 .0023 .0097 .0268 .0566 .0985 .1471 .1931 .2256

7 .0000 .0000 .0003 .0017 .0064 .0173 .0379 .0701 .1128 .1611

8 .0000 .0000 .0000 .0002 .0011 .0037 .0102 .0234 .0462 .0806

9 .0000 .0000 .0000 .0000 .0001 .0005 .0018 .0052 .0126 .0269

10 .0000 .0000 .0000 .0000 .0000 .0000 .0002 .0007 .0021 .0054

11 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0002 .0005

12 0 .5504 .2824 .1422 .0687 .0317 .0138 .0057 .0022 .0008 .0002

1 .3413 .3766 .3012 .2062 .1267 .0712 .0368 .0174 .0075 .0029

2 .0988 .2301 .2924 .2835 .2323 .1678 .1088 .0639 .0339 .0161

3 .0173 .0852 .1720 .2362 .2581 .2397 .1954 .1419 .0923 .0537

4 .0021 .0213 .0683 .1329 .1936 .2311 .2367 .2128 .1700 .1208

5 .0002 .0038 .0193 .0532 .1032 .1585 .2039 .2270 .2225 .1934

6 .0000 .0005 .0040 .0155 .0401 .0792 .1281 .1766 .2124 .2256

7 .0000 .0000 .0006 .0033 .0115 .0291 .0591 .1009 .1489 .1934

8 .0000 .0000 .0001 .0005 .0024 .0078 .0199 .0420 .0762 .1208

9 .0000 .0000 .0000 .0001 .0004 .0015 .0048 .0125 .0277 .0537

10 .0000 .0000 .0000 .0000 .0000 .0002 .0008 .0025 .0068 .0161

11 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0003 .0010 .0029

12 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0002

143Probabilitatea eta probabilitate-banaketak

Page 156: Estatistika teoria eta praktika SPSSWIN erabiliz

BANAKETA BINOMIALEN TAULA (3)

N k .05 .10 .15 .20 .25 .30 .35 .40 .45 .50

13 0 .5133 .2542 .1209 .0550 .0238 .0097 .0037 .0013 .0004 .0001

1 .3512 .3672 .2774 .1787 .1029 .0540 .0259 .0113 .0045 .0016

2 .1109 .2448 .2937 .2680 .2059 .1388 .0836 .0453 .0220 .0095

3 .0214 .0997 .1900 .2457 .2517 .2181 .1651 .1107 .0660 .0349

4 .0028 .0277 .0838 .1535 .2097 .2337 .2222 .1845 .1350 .0873

5 .0003 .0055 .0266 .0691 .1258 .1803 .2154 .2214 .1980 .1571

6 .0000 .0008 .0063 .0230 .0559 .1030 .1546 .1968 .2169 .2095

7 .0000 .0001 .0011 .0058 .0186 .0442 .0833 .1312 .1775 .2095

8 .0000 .0000 .0001 .0011 .0047 .0142 .0336 .0656 .1089 .1571

9 .0000 .0000 .0000 .0001 .0009 .0034 .0101 .0243 .0495 .0873

10 .0000 .0000 .0000 .0000 .0001 .0006 .0022 .0065 .0162 .0349

11 .0000 .0000 .0000 .0000 .0000 .0001 .0008 .0012 .0036 .0095

12 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0005 .0016

13 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001

14 0 .4877 .2288 .1028 .0440 .0178 .0068 .0024 .0008 .0002 .0001

1 .3593 .3559 .2539 .1539 .0832 .0407 .0181 .0073 .0027 .0009

2 .1229 .2570 .2912 .2501 .1802 .1134 .0634 .0317 .0141 .0056

3 .0259 .1142 .2056 .2501 .2402 .1943 .1366 .0845 .0462 .0222

4 .0037 .0349 .0998 .1720 .2202 .2290 .2022 .1549 .1040 .0611

5 .0004 .0078 .0352 .0860 .1468 .1963 .2178 .2066 .1701 .1222

6 .0000 .0013 .0093 .0322 .0734 .1262 .1759 .2066 .2088 .1833

7 .0000 .0002 .0019 .0092 .0280 .0618 .1082 .1574 .1952 .2095

8 .0000 .0000 .0003 .0020 .0082 .0232 .0510 .0918 .1398 .1833

9 .0000 .0000 .0000 .0003 .0018 .0066 .0183 .0408 .0762 .1222

10 .0000 .0000 .0000 .0000 .0003 .0014 .0049 .0136 .0312 .0611

11 .0000 .0000 .0000 .0000 .0000 .0002 .0010 .0033 .0093 .0222

12 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0005 .0019 .0056

13 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0002 .0009

14 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001

15 0 .4633 .2059 .0874 .0352 .0134 .0047 .0016 .0005 .0001 .0000

1 .3658 .3432 .2312 .1319 .0668 .0305 .0126 .0047 .0016 .0005

2 .1348 .2669 .2856 .2309 .1559 .0916 .0476 .0219 .0090 .0032

3 .0307 .1285 .2184 .2501 .2252 .1700 .1110 .0634 .0318 .0139

4 .0049 .0428 .1156 .1876 .2252 .2186 .1792 .1268 .0780 .0417

5 .0006 .0105 .0449 .1032 .1651 .2061 .2123 .1859 .1404 .0916

6 .0000 .0019 .0132 .0430 .0917 .1472 .1906 .2066 .1914 .1527

7 .0000 .0003 .0030 .0138 .0393 .0811 .1319 .1771 .2013 .1964

8 .0000 .0000 .0005 .0035 .0131 .0348 .0710 .1181 .1647 .1964

9 .0000 .0000 .0001 .0007 .0034 .0116 .0298 .0612 .1048 .1527

10 .0000 .0000 .0000 .0001 .0007 .0030 .0096 .0245 .0515 .0916

11 .0000 .0000 .0000 .0000 .0001 .0006 .0024 .0074 .0191 .0417

12 .0000 .0000 .0000 .0000 .0000 .0001 .0004 .0016 .0052 .0139

13 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0003 .0010 .0032

14 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0005

15 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000

144

Page 157: Estatistika teoria eta praktika SPSSWIN erabiliz

BANAKETA BINOMIALEN TAULA (4)

N k .05 .10 .15 .20 .25 .30 .35 .40 .45 .50

16 0 .4401 .1853 .0743 .0281 .0100 .0033 .0010 .0003 .0001 .00001 .3706 .3294 .2097 .1126 .0535 .0228 .0087 .0030 .0009 .00022 .1463 .2745 .2775 .2111 .1336 .0732 .0353 .0150 .0056 .00183 .0559 .1423 .2295 .2463 .2079 .1465 .0888 .0468 .0215 .00854 .0061 .0514 .1311 .2001 .2252 .2040 .1553 .1014 .0572 .02785 .0008 .0137 .0555 .1201 .1802 .2099 .2008 .1623 .1123 .06676 .0001 .0028 .0180 .0550 .1101 .1649 .1982 .1983 .1684 .12227 .0000 .0004 .0045 .0917 .0524 .1010 .1524 .1889 .1969 .17468 .0000 .0001 .0009 .0055 .0197 .0487 .0923 .1417 .1812 .19649 .0000 .0000 .0001 .0012 .0058 .0185 .0442 .0840 .1318 .174610 .0000 .0000 .0000 .0002 .0014 0056 .0167 .0392 .0755 .122211 .0000 .0000 .0000 .0000 .0002 .0013 .0049 .0142 .0337 .066712 .0000 .0000 .0000 .0000 .0000 .0002 .0011 .0040 .0115 .027813 .0000 .0000 .0000 .0000 .0000 .0000 .0002 .0008 .0029 .008514 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0005 .001815 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .000216 .0000 .0000 .0000 .0000 .0000 .0000 .0000 0000 .0000 .0000

17 0 .4181 .1668 .0631 .0225 .0075 .0023 .0007 .0002 .0000 .00001 .3741 .3150 .1893 .0957 .0426 .0169 .0060 .0019 .0005 .00012 .1557 .2800 .2673 .1914 .1136 .0581 .0260 .0102 .0035 .00103 .0415 .1556 .2359 .2393 .1893 .1245 .0701 .0341 .0144 .00524 .0076 .0605 .1457 .2093 .2209 .1868 .1320 .0796 .0411 .01825 .0010 .0175 .0668 .1361 .1914 .2081 .1849 .1479 .0875 .04726 .0001 .0039 .0236 .0680 .1276 .1784 .1991 .1839 .1432 .09447 .0000 .0007 .0065 .0267 .0668 .1201 .1685 .1927 .1841 .14848 .0000 .0001 .0041 .0084 .0279 .0644 .1143 .1606 .1883 .18559 .0000 .0000 .0003 .0021 .0093 .0276 .0611 .1070 .1540 .185510 .0000 .0000 .0000 .0004 .0025 .0095 .0263 .0571 .1008 .148411 .0000 .0000 .0000 .0001 .0005 .0026 .0090 .0242 0525 .094412 .0000 .0000 .0000 .0000 .0001 .0006 .0024 .0081 .0215 .047213 .0000 .0000 .0000 .0000 .0000 .0001 .0005 .0021 .0068 .018214 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0004 .0016 .005215 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0003 .001016 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .000117 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000

18 0 .3972 .1501 .0536 .0180 .0056 .0016 .0004 .0001 .0000 .00001 .3763 .3002 .1704 .0811 .0338 .0126 .0042 .0012 .0003 .00012 .1683 .2835 .2556 .1723 .0958 .0458 .0190 .0069 .0022 .00063 .0473 .1680 .2406 .2297 .1704 .1046 .0547 .0246 .0095 .00314 .0093 .0700 .1592 .2153 .2130 .1681 .1104 .0614 .0291 .01175 .0014 .0218 .0787 .1507 .1988 .2017 .1664 .1146 .0666 .03276 .0002 .0052 .0310 .0816 .1436 .1873 .1941 .1655 .1181 .07087 .0000 .0010 .0091 .0350 .0820 .1376 .1792 .1892 .1657 .12148 .0000 .0002 .0022 .0120 .0376 .0811 .1327 .1734 .1864 .16699 .0000 .0000 .0004 .0033 .0139 .0386 .0794 .1284 .1694 .185510 .0000 .0000 .0001 .0008 .0042 .0149 .0385 .0771 .1248 .166911 .0000 .0000 .0000 .0001 .0010 .0046 .0151 .0374 .0742 .121412 .0000 .0000 .0000 .0000 .0002 .0012 .0047 .0145 .0354 .070813 .0000 .0000 .0000 .0000 .0000 .0002 .0012 .0045 .0134 .032714 .0000 .0000 .0000 .0000 .0000 .0000 .0002 .0011 .0039 .011715 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0002 .0009 .003116 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .000617 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .000118 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000

145Probabilitatea eta probabilitate-banaketak

Page 158: Estatistika teoria eta praktika SPSSWIN erabiliz

BANAKETA BINOMIALEN TAULA (5)

N k .05 .10 .15 .20 .25 .30 .35 .40 .45 .50

19 0 .3774 .1351 .0456 .0144 .0042 .0011 .0003 .0001 .0000 .0000

1 .3774 .2852 .1529 .0658 .0268 .0093 .0029 .0008 .0002 .0000

2 .1787 .2852 .2428 .1540 .0803 .0358 .0138 .0046 .0013 .0003

3 .0533 .1796 .2428 .2182 .1517 .0869 .0422 .0175 .0062 .0018

4 .0112 .0798 .1714 .2182 .2023 .1491 .0909 .0467 .0203 .0074

5 .0018 .0266 .0907 .1636 .2023 .1916 .1468 .0933 .0497 .0222

6 .0002 .0069 .0374 .0955 .1574 .1916 .1844 .1451 .0949 .0518

7 .0000 .0014 .0122 .0443 .0974 .1525 .1844 .1797 .1443 .0961

8 .0000 .0002 .0032 .0166 .0487 .0981 .1489 .1789 .1771 .1442

9 .0000 .0000 .0007 .0051 .0198 .0154 .0980 .1464 .1771 .1762

10 .0000 .0000 .0001 .0013 .0066 .0220 .0528 .0976 .1449 .1762

11 .0000 .0000 .0000 .0003 .0018 .0077 .0233 .0532 .0970 .1442

12 .0000 .0000 .0000 .0000 .0004 .0022 .0083 .0237 .0529 .0961

13 .0000 .0000 .0000 .0000 .0001 .0005 .0024 .0085 .0233 .0518

14 .0000 .0000 .0000 .0000 .0000 .0000 .0006 .0024 .0082 .0222

15 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0005 .0022 .0074

16 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0005 .0018

17 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0003

18 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000

19 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000

20 0 .3585 .1216 .0388 .0115 .0032 .0008 .0002 .0000 .0000 .0000

1 .3774 .2702 .1368 .0576 .0211 .0068 .0020 .0005 .0001 .0000

2 .1887 .2852 .2293 .1369 .0669 .0287 .0100 .0031 .0008 .0002

3 .0596 .1901 .2428 .2054 .1339 .0716 .0323 .0123 .0040 .0011

4 .0133 .0898 .1821 .2182 .1897 .1304 .0738 .0350 .0139 .0046

5 .0022 .0319 .1028 .1746 .2023 .1789 .1272 .0746 .0365 .0148

6 .0003 .0089 .0454 .1091 .1686 .1916 .1712 .1244 .0746 .0370

7 .0000 .0020 .0160 .0545 .1124 .1643 .1844 .1659 .1221 .0739

8 .0000 .0004 .0046 .0222 .0609 .1144 .1614 .1797 .1623 .1201

9 .0000 .0001 .0011 .0074 .0271 .0654 .1158 .1597 .1771 .1602

10 .0000 .0000 .0002 .0020 .0099 .0308 .0686 .1171 .1593 .1762

11 .0000 .0000 .0000 .0005 .0030 .0120 .0336 .0710 .1185 .1602

12 .0000 .0000 .0000 .0001 .0008 .0039 .0136 .0355 .0727 .1201

13 .0000 .0000 .0000 .0000 .0002 .0010 .0045 .0146 .0366 .0739

14 .0000 .0000 .0000 .0000 .0000 .0002 .0012 .0049 .0150 .0370

15 .0000 .0000 .0000 .0000 .0000 .0000 .0003 .0013 .0049 .0148

16 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0003 .0013 .0046

17 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0002 .0011

18 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0002

19 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000

20 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 0000 .0000

Beste zenbait banaketa diskretu: Pascal, Poisson

Aldagai diskretuei dagozkien beste bi banaketa berri aztertuko ditugu: Pascal edo binomial negatiboenbanaketa eta Poissonen banaketa.

4.5.3. Pascalen banaketa

Pascalen banaketa, banaketa binomialaren ondorio bezala kontsidera dezakegu, funtsean eskema teorikoberdinean oinarritzen baita. Bernouilliren N esperimentu errepikatzen dira, baina banaketa binomialean

146

Page 159: Estatistika teoria eta praktika SPSSWIN erabiliz

bezala esperimentuen kopuruak aurretik jarria egon beharrean, kasu honetan esperimentuen kopuruaizango da, hain zuzen, aldagai aleatorioa. Hots, aldagai aleatorioa, k arrakasta lortzeko beharrezko direnN esperimentuen kopuru bezala definitzen da.

Nahiz eta Pascalen banaketaren berezitasunak aztertzera sartu ez, banaketa binomialarekin duen erla-zioa azter dezakegu. Banaketa binomialean aldagai aleatorioa K arrakasta-kopurua zen, Bernouillirenesperimentua N aldiz errepikatzen genuenean. Pascalen kasuan K arrakasta lortzeko beharrezkoak direnN esperimentuen balioa izango da. Baina Ngarren saioan kgarren arrakasta lortzeko, N-1 esperimentutank-1 arrakasta lortu beharko dira eta hurrengo saioan baita arrakasta lortu ere.

Beraz Pascal edo binomial negatiboen banaketa labur dezakegu honakoa esanez: Bernouilliren espe-rimentua N-1 aldiz errepikatuz k-1 arrakasta izanik (hau banaketa binomial arrunt bat da), Ngarren espe-rimentuan ere arrakasta lortzea.

Probabilitateak kalkulatzeko identitate hauek idatz ditzakegu:

P (k-garren arrakasta N-garren saioan) =

P (k-1 arrakasta N-1 saiotan eta arrakasta N-garrenean) =

P (k-1 arrakasta N-1 saiotan) * P (arrakasta N-garrenean) =

Binomiala (N-1 , K -1, p) * p

Beraz, txanpon bat airera botatzean pil ateratzeko probabilitatea 0.50 bada, 5 pil 8. aldian lortzekoprobabilitatea kalkulatu nahi badugu, banaketa binomialaren taula honela erabiliko dugu:

Lehenengo arazoa birplanteatuko dugu: 8garren saioan 5garren arrakasta (pil) lortzeko, 7 lehenengosaiotan 4 arrakasta lortu behar dira eta 8garrenean berriro arrakasta edo pil lortu behar dugu. Gure pro-babilitatea bi probabilitate hauek biderkatuz lortuko dugu.

P (5garren arrakasta 8garren saioan) =

P (4 arrakasta 7 saiotan eta arrakasta 8garrenean) =

P (4 arrakasta 7 saiotan) * P (arrakasta 8garrenean) =

Binomiala ( 7,4,0.50) * 0.50 = 0.2734 * 0.50 = 0.1367

Eta era honetan Pascalen banaketari jarraituz edozein aldagairen probabilitateak kalkula ditzakegu.

4.5.4. Poissonen banaketa

Batzuetan, banaketa binomialen kasuan, gure esperimentua 20 aldiz baino gehiagotan errepikatuko dugu,hau da, txanpona 20 aldiz baino gehiagotan botatzen dugu airera, edo ikasle-talde bati pasatzen dioguntestak 20 galdera baino gehiago edukiko ditu. Kasu hauetan, banaketa binomialari jarraitzen gatzaizkio-la kontuan hartuta, banaketa honen taulara jo beharko genuke, baina taula arruntetan N=20 baino baliohandiagoen probabilitaterik ez dugu edukiko. Honelakoetan, gure probabilitateen kalkulua Poissonenbanaketaren bidez egingo dugu kasu batzuetan eta banaketa normalaren bidez beste batzuetan.

Aipatu dugun kasua, Poissonen banaketaren kasu tipikoena da, baina beste probabilitate asko kalku-latzeko ere erabiltzen da. Kasu nabarmenenak ondoren aipatzen ditugunen antzekoak izango dira:

.– Leihatila baten aurrean egongo den ilararen pertsona-kopuruen probabilitateak kalkulatzea.

.– Egun bateko istripu-kopuruaren probabilitatea kalkulatzea.

147Probabilitatea eta probabilitate-banaketak

Page 160: Estatistika teoria eta praktika SPSSWIN erabiliz

Poissonen probabilitate-funtzioa ondoko formula honek adierazten du:

mkf (x) = P ( x = k ) = ––––– e-m

k !

Poissonen banaketaren probabilitatea kalkulatu baino lehen, banaketak daukan parametro bakarrakezaguna izan beharko du. Parametro hau, batezbestekoa adierazten duena izango da, eta m letrarenbidez izendatuko dugu. Parametro hau kalkulatzeko, banaketa binomialen N eta p parametroak erabili-ko ditugu.

m = N * p

m balioak, arrakasten batezbestekoen kopurua adierazten du.

Poisson-en banaketaren taulak erabiltzeko, m parametroen balioak ere ezaguna izan beharko du.Balio hau ezagutu ondoren, hurrengo orrialdeetan aurkezten diren taulak erabiliko ditugu.

Gertaera baten probabilitatea kalkulatzeko, arrakasta-kopuruen balioa jakin ondoren, m parametroenbalioari dagokion blokean, eta k arrakasta-kopuruen lerroan bilatuko dugu gure probabilitatea. Kontuanhartu behar dugu agertzen den balioa ez dela gure gertaeren probabilitatea, probabilitate metatua baizik.Adibidez, demagun m=1.6 izanda, K=3 arrakasta lortzeko probabilitatea kalkulatu nahi dugula. m=1.6blokean K=3ri dagokion lerroan aurkitzen dugun balioa .21664 da. Baina balio hau 3 arrakasta edo gehia-go lortzeko gertaeren probabilitatea da. Guk 3 arrakasta lortzeko probabilitatea kalkulatu nahi dugunez,honela jokatuko dugu: 3 arrakasta lortzea era honetara idatziko dugu: 3 edo gehiago lortzea eta 4 edogehiago EZ lortzea.

Hortik, gure probabilitatea:

P(3 arrakasta) = P( 3 edo gehiago) – P ( 4 edo gehiago)

P(3 arrakasta) = .21664 – .07881 = .13783

Beste adibide bat ikusiko dugu.

Demagun ikastola bateko ikasleen % 5ek irakurketa-arazoak dituela. Guk aztertu nahi dugun gelan 40ikasle badaude, kalkulatu nahi ditugun probabilitateak ondoko bi gertaeren probabilitateak izango dira:gure gelan 2 ikaslek arazoak edukitzea edo gure gelan 6 ikaslek edo gehiagok arazoak edukitzea.

Kasu bietan m parametroen balioa berdina izango da, eta honela kalkulatuko dugu:

m = N * p = 40 * 0.05 = 2.0

Bigarren gertaeren probabilitatea taulak zuzenean emango digu; lehen esan dugunez, taulak ematendizkidan balioak probabilitate metatuenak baitira. Hau da m = 2.0 blokean K=6 balioari dagokion balio-ak adierazten duena, 6 arrakasta edo gehiago lortzeko daukagun probabilitatea izango da. Probabilitatehau, kasu honetan, .01656, da.

Lehengo probabilitatea kalkulatzeko, k = 2, balioari dagokion probabilitatearen eta k =3 balioari dago-kionaren arteko kenketa egin beharko dugu. Hau da, 2 ikaslek arazoak edukitzeko probabilitatea, 2 edogehiagok edukitzeko eta 3 edo gehiagok edukitzeko probabilitateen kenketa izango da.

Gure kasuan hau izango da:

P (2 arrakasta) = P (2 edo gehiago) – P (3 edo gehiago)

P(3 arrakasta) = .59399 – .32332 = .27067

148

Page 161: Estatistika teoria eta praktika SPSSWIN erabiliz

POISSONEN BANAKETEN TAULA. PROBABILITATE METATUAK

k m = 0.2 m = 0.3 m = 0.4 m = 0.5 m = 0.6

0 1.00000 1.00000 1.00000 1.00000 1.00000

1 .18127 .25918 .32968 .39347 .45119

2 .01752 .03694 .06155 .09020 .12190

3 .00115 .00360 .00793 .01439 .02311

4 .00006 .00027 .00078 .00175 .00336

5 .00000 .00002 .00006 .00017 .00039

6 .00000 .00000 .00000 .00001 .00004

k m = 0.7 m = 0.8 m = 0.9 m = 1.0 m = 1.2

0 1.00000 1.00000 1.00000 1.00000 1.00000

1 .50341 .55067 .59343 .63212 .69880

2 .15580 .19120 .22751 .26424 .33737

3 .03414 .04742 .06285 .08030 .12051

4 .00575 .00908 .01345 .01898 .03377

5 .00078 .00141 .00234 .00366 .00775

6 .00009 .00018 .00034 .00059 .00150

7 .00000 .00002 .00004 .00008 .00025

8 .00000 .00000 .00000 .00001 .00004

9 .00000 .00000 .00000 .00000 .00000

k m = 1.4 m = 1.6 m = 1.8 m = 2.0 m = 2.5

0 1.00000 1.00000 1.00000 1.00000 1.00000

1 .75340 .79810 .83470 .86466 .91791

2 .40817 .47507 .53716 .59399 .71270

3 .16650 .21664 .26938 .32332 .45619

4 .05372 .07881 .10871 .14288 .24242

5 .01425 .02368 .03641 .05265 .10882

6 .00320 .00604 .01038 .01656 .04202

7 .00062 .00134 .00257 .00453 .01419

8 .00011 .00026 .00056 .00110 .00425

9 .00002 .00005 .0001 .00024 .00114

10 .00000 .00001 .00002 .00005 .00027

k m = 3.0 m = 3.5 m = 4.0 m = 4.5 m = 5.0

0 1.00000 1.00000 1.00000 1.00000 1.00000

1 .95021 .96980 .98168 .98889 .99326

2 .80085 .86411 .90842 .93890 .95957

3 .57681 .67915 .76190 .82642 .87535

4 .35277 .46337 .56653 .65770 .73497

5 .18474 .27456 .37116 .46790 .55951

6 .08392 .14239 .21487 .29707 .38404

7 .03351 .06529 .11067 .16895 .23781

8 .01191 .02674 .05113 .08659 .13372

9 .00380 .00987 .02136 .04026 .06809

10 .00110 .00332 .00813 .01709 .03183

11 .00029 .00102 .00284 .00667 .01369

12 .00017 .00029 .00092 .00240 .00545

13 .00008 .00018 .00027 .00080 .00202

14 .00000 .00002 .00008 .00025 .00070

15 .00000 .00000 .00002 .00007 .00022

149Probabilitatea eta probabilitate-banaketak

Page 162: Estatistika teoria eta praktika SPSSWIN erabiliz

4.6. ARIKETAK: PROBABILITATEA

1.- Kutxa batean bola hauek dauzkagu: hiru gorri, lau zuri eta bost hori. Begiratu gabe bola bat atera-tzen badugu, kalkula itzazu ondoko gertaeren probabilitateak:

a) bola gorria 4/12b) bola gorria edo zuria 7/12c) bola gorria eta horia 0d) bola ez gorria 8/12e) bola ez gorria edo zuria 8/12f) bola ez zuria eta horia 5/12g) bola ez horia edo ez gorria 1h) bola ez gorria eta ez zuria 5/12

2.- Demagun karta-sorta batetik karta bat ateratzen dugula, kalkula itzazu ondoko gertaeren probabili-tateak:

a) ezpata edo kopa 20/40b) kopa eta ez bastoia 10/40c) zenbaki bakoitia 20/40d) irudia edo kopa 19/40e) urrea eta ez irudia 7/40f) ez urrea edo kopa 30/40g) ez urrea eta ez kopa 20/40h) ez kopa edo ez bastoia 40/40i) ez irudia edo ez kopa 37/40

3.- Demagun dado bat airera botatzen dugula. Kalkulatu ondoko gertaeren probabilitateak:

a) Zenbaki bakoitia ateratzekoa 3/6 b) Sei bat edo bikoitia ateratzekoa 3/6c) Zenbaki lehena ateratzekoa 4/6

Bigarren dado bat airera botatzen badugu, zein izango da dado bietan agertzen diren baloreen batu-ra bikoitia izateko dagoen probabilitatea? Eta batura hori 4 baino handiagoa eta 8 baino txikiagoaizatekoa? Eta agertzen diren baloreen kendura bakoitia izateko dagoen probabilitatea? Eta zenbakiberdinak izatekoa?

Emaitza: 18/36, 15/36, 18/36, 6/36

4.- Bi dado airera botatzen baditugu, zein da 6 bat lortzeko daukagun probabilitatea? Eta gutxienez 6bat lortzekoa? Eta ikusten diren aurpegi bien batura 6 izatekoarena? Eta biak berdinak izatekoarena?

5.- Erantzuteko 4 aukera dituzten 2 item ditugu. Lehenengo itemaren erantzun egokia a aukera da etabigarrenena d aukera. Ikasle batek item biak zoriz, pentsatu gabe, erantzuten baditu, kalkulatu ondo-rengo probabilitateak:

a) biak ondo erantzutekoa.b) lehenengoa ondo eta bigarrena gaizki erantzutekoa.c) biak gaizki erantzutekoa.d) gutxienez bat ondo erantzutekoa.

6.- Fakultate batean, ikasketak hasten dituztenetatik bukatzen dutenak % 60 dira. Aurten sartu berriakdiren 10 ikasle hartzen baditugu, zein da ikasle hauetatik, hiruk bakarrik karrera bukatzeko dagoenprobabilitatea?

150

Page 163: Estatistika teoria eta praktika SPSSWIN erabiliz

7.- Fakultate ezberdinetako ikasleei Selektibitateko azterketari buruzko iritzia galdetu diegu, eta ondo-rengo taulan agertzen diren emaitzak lortu ditugu.

Zuzenbidea Informatika Psikologia Hezkuntza

Alde 320 250 510 45

Aurka 500 150 520 200

Ez daki/ ez du erantzun 200 50 210 35

Ikasle bat zoriz aukeratzen badugu, kalkula itzazu ondoko gertaeraren probabiliateak.

a) Selektibitatearen alde egotekoa.b) Informatika Fakultateakoa izatekoa.c) Selektibitatearen aurka baldin badago, Hezkuntza Fakultatekoa izatekoa.d) Zuzenbide Fakultatekoa baldin bada, selektibitatearen alde egotekoa.

8.- Filosofia eta Hezkuntza Zientzien Fakultatean, % 18 gizonezkoak dira. Badakigu Gipuzkoan jaiota-koak % 75 direla ere. Emakumeen artean, % 80 Gipuzkoakoak dira. Kalkula itzazu ondoko taulakoportzentaia guztiak.

Gipuzkoakoak Ez Gipuzkoakoak

Gizonezkoak % 18

Emakumezkoak % 82

% 75 % 25

a) Zein da emakumea izanik, Gipuzkoakoa izateko dagoen probabilitatea?b) Zein da Gipuzkoakoa ez bada, gizonezkoa izateko dagoen probabilitatea?c) Zein da Gipuzkoakoa eta gizonezkoa izateko dagoen probabilitatea?

9.- Psikologia eta Hezkuntza Zientzien ikastetxean, % 60 Psikologiako ikasleak dira. Lan bat egiteko,zoriz, 15 ikasle aukeratu baldin baditugu, kalula itzazu ondorengo probabilitateak:

a) 12 Psikologiakoak izatekoa.b) gutxienez 10 Psikologiakoak izatekoa.c) Gehienez 7 Filosofia eta Hezkuntza Zientzikoak izatekoa.

10.- Euskal Herriko Unibertsiatatean % 60 emakumeak dira. Ikasle bat aukeratzen badugu, Psikologiakoaizateko dagoen probabilitatea 0.02 da. Bestalde, gizonezkoa eta psikologiakoa izateko dagoen pro-babilitatea 0.004 da. Zoriz espediente bat aukeratzen badugu, eta gizonezkoa dela baldin badaki-gu, Psikologiakoa izateko probabilitatea kalkulatu. Eta gizonezkoa edo Psikologiakoa izateko dago-en probabilitatea. Askeak dira gizonezkoa izan eta Psikologiakoa izatea gertaerak?

11.- OHOko 8. mailako ikasleen % 10ek irakurketa-arazoak dituela gauza jakina da. Irakurketa-arazoakdituzten umeetatik, % 60k moldaketa-arazoak ere badituzte. OHOko 8. mailako, 250 ikaslerekinosatutako lagin bat aukeratzen badugu, zein da irakurketa-arazoak dituzten ikasle-kopuru proba-bleena? eta moldaketa-arazoekin? Orain beste laginketa bat egiten dut, 100 ikaslerena, baina kasuhonetan denak irakurketa-arazoak dituztenak dira. Zein da talde honetan moldaketa-arazoak izate-ko ikasle-kantitate probableena?

12.- 8 eta 9 urteko umeen % 25ek irakurketa-arazoak izaten ditu. Eskolara iritxi berria den irakasle batekbere gelan adin horretako 15 ikasle ditu. Zein da gela horretan arazoak izan dituen ikasle-kopuruprobableena? Zein da arazoak dituen 8 ikasle edo gutxiago izateko probabilitatea?

151Probabilitatea eta probabilitate-banaketak

Page 164: Estatistika teoria eta praktika SPSSWIN erabiliz

13.- Donostiako fakultate batean 5.674 ikasle daude matrikulatuta. Hauetatik frantsesa ezagutzen dute-nak 2.314 dira eta ingelesa ezagutzen dutenak 698. Hizkuntza biak menderatzen dituztenak 128dira. Ikasle bat zoriz aukeratzen badugu, kalkula itzazu ondoko probabilitateak:

a) Ingelesa ezagutzekoa.b) Bietatik bat ezagutzekoa.c) Ingelesa bai eta frantsesa ez ezagutzekoa. d) Bat ere ez ezagutzekoa.e) Patxik frantsesez ez badu egiten, zein da ingelesa ezagutzeko daukan probabilitatea?

14.- Kutxa batean bola hauek dauzkagu: hiru gorri, lau zuri eta bost hori. Begiratu gabe bi bola ateratzenbaditugu, kalkula itzazu ondoko gertaeren probabilitateak:

a) lehenengo bola gorria eta bigarrena zuria izatekoa.b) bigarrena horia izatekoa.

(Kalkula itzazu bi kasu hauetan: lehenengo bola ikusi ondoren kutxontzira bueltatzen denean etabueltatzen ez denean).

Emaitza: 1/12, 5/12 —— 1/11, 5/12

15.- Ikasle batek bi azterketa egin behar ditu. Lehenengo azterketa % 85ek gainditzen dute, eta bigarre-na % 90ek. Kalkula itzazu ondoko gertaeren probabilitateak:

a) Azterketa biak gainditzekoa.b) Bat gainditzekoa.c) gutxienez bat gainditzekoa.d) bat ere ez gainditzekoa. Emaitza: 0.765, 0.22, 0.985, 0.015

16.- P (A) = 0.60 , P (B) = 0.50 eta P (A U B) = 0.90 badira, kalkula itzazu: P (A ∩B), P (A/B), P (B/A).

Emaitza: 0.20, 0.40, 0.333

17.- A kutxan 5 bola beltz eta bi gorri dauzkagu eta B kutxan 3 beltz eta 2 gorri. A kutxatik bola bat hartueta B-ra pasatzen dugu. Ondoren, B kutxatik bola bat ateratzen dugu. Kalkula itzazu ondoko gerta-eren probabilitateak:

a) A kutxatik B kutxara pasatu dugun bola beltza izatekoa.

b) B kutxatik atera dugun bola, hau da, bigarren atera duguna, beltza izatekoa.

c) A kutxatik bi bola ateratzen baditugu, zein da lehenengoa beltza eta bigarrena gorria izatekodagoen probabilitatea?

d) Oraingo kasuan, lehenengo A kutxatik B kutxara bola bat pasatzen dugu, eta gero bigarren Bkutxa honetatik bi bola ateratzen ditugu. Zein da lehenengoa beltza eta bigarrena gorria izatekodagoen probabilitatea?

Emaitza: 5/7, 26/42, 10/42, 58/210

18.- Demagun karta-sorta batetik bi karta ateratzen ditugula; kalkula itzazu ondoko gertaeren probabili-tateak:

a) Biak ezpata izatekoa.b) Bata ezpata eta bestea urrea izatekoa.c) Lehenengoa ezpata eta bigarrena urrea izatekoa.d) Biak zenbaki berdinekoak izatekoa.

Egin aurreko kalkuluak, karta-sortara itzultzen den kasuan eta itzultzen ez denean.

Emaitzak: 100/1600, 200/1600, 100/1600, 4/4090/1560, 200/1560, 100/1560, 3/39

152

Page 165: Estatistika teoria eta praktika SPSSWIN erabiliz

19.- Kutxa batean hiru txanpon dauzkagu: lehenengoak bi pil dauzka, bigarrena arrunta da eta hiruga-rrena gaizki eginda dago; txanpon honetan pil lortzeko probabilitatea 0.40 da. Kutxatik ateratakotxanpon bat airera botatzen badugu, kalkula ezazu zein den pil lortzeko probabilitatea.

Emaitza: 19/30

20.- Ikasle batek bi azterketa egin behar ditu. Lehenengo azterketa % 85ek gainditzen du, eta bigarrena% 90ek. Badakigu, azterketa biak % 80k gainditzen dituela ere. Badakigu Patxik, lehenengo azter-keta gainditu duela. Zein da Patxik, bigarren azterketa gainditzeko duen probabilitatea? Eta lehe-nengo azterketa gainditu ez balu?

Emaitza: 80/85, 10/15

21.- Errealak Athletic-i, futbol-zelaia bustita dagoenean, % 95ean irabazten dio, eta zelaia lehor baldinbadago % 40an ez dio irabazten. Azaroaren bostean Errealak Athletic-i irabazi egin zion. Garai har-tako estatistikak dioenez egun haietan % 60an euria izan zen. Zein da, orain begiratuta, egun har-tan euria izateko probabilitatea?

Emaitza: 0.692

22.- Gaixo batek A edo B gaitza dauka. A gaitza edukitzeko probabilitatea % 20 da. Sendagileak analisibatzuk agintzen dizkio eta hauek aldekoak edo kontrakoak izan daitezke. Gaixo batek A gaitza dau-kanean analisiak kontrakoak izaten dira % 99an eta B gaitza daukanean kontrakoak izaten dira% 5ean. Gaixoen analisia kontrakoa izan bada, zein da A gaitza edukitzeko probabilitatea?

Emaitza: 0.831

23.- Gure fakultatean, gizonen % 5 eta emakumeen % 1, 1.80 m baino altuagoa da. Badakigu, fakulta-teko ikasleen % 70 emakumezkoak direla ere. Ikasle bat zoriz aukeratzen dugu eta ikasle honenaltuera 1.80 baino handiagoa da. Zein da emakumezkoa izateko dagoen probabilitatea? Zein datopatzen dugun lehenengo pertsonaren altuera 1.80 baino handiagoa izateko dagoen probabilitatea?

Emaitza: 0.31, 0.022

24.- Kutxa batean bost eskularru-pare ezberdin baditugu, eta zoriz bi eskularruen aukeratzen baditugu,zein da biak pare berekoak izateko dagoen probabilitatea?

Emaitza: 1/9

25.- P (A) = 0.80, eta P (B) = 0.30, badira eta A eta B gertaera askeak badira ondorengo probabilitateakkalkulatu:

P(A∩B), P(AUB), P(A/B), P(B/A)

Emaitzak: 0.24, 0.86, 0.8, 0.3

26.- Demagun lau dado airera botatzen ditugula. X aldagaia era honetara definituko dugu “2 baloreaagertu den maiztasuna”. Kalkulatu aldagaien itxaropen matematikoa eta bariantza.

Emaitzak: 864/1296, 0.4981

27.- Ondoan ematen den bi sarreratako laukia bete ondoren, azter ezazu aldagaien arteko erlazioakomeni den indize estatistikoa erabiliz:

X 2 7 12

Y

0 0.10 0.15 0.30

1 0.00 0.35

4 0.20

0.40 0.20

153Probabilitatea eta probabilitate-banaketak

Page 166: Estatistika teoria eta praktika SPSSWIN erabiliz

Kalkula itzazu probabilitate hauek:

a) X=2, Y=4b) X=2 eta Y=4 c) X=2 dela jakinik, Y=1 izatekoa.d) Xek 2 balorea ez badu hartzen, Y=4 izatekoa

28.- Ikastetxe bateko 300 ikasleak, X (anai-arreba kopurua) eta Y (asignatura bat gainditu ala ez) irizpi-deak erabiliz sailkatu ditugu. Badakigu 100 ikaslek gai hau ez dutela gainditu, 120 ikasle seme edoalaba-bakarrak direla eta 100 ikaslek gutxienez beste anai-arreba bat badutela (60k 2 anai-arreba eta40k 3). Badakigu gainditu ez dutenen erdiak anai-arreba bakar bat dutela, beste 20k ez duela senide-rik. Azkenik, 3 anai-arreba dituztenetatik, erdiak ez du gainditu. Azter ezazu aldagaien arteko erla-zioa.

29.- 4 txanpon airera botatzen baditugu, kalkula itzazu ondoko gertaeren probabilitateak.

a) 4 pil lortzekoa.b) gutxienez pil bat lortzekoa.c) gehienez bat lortzekoa.d) pil-ik ez lortzekoa.

30.- Gela batean 12 ikasle daude. Hauetatik 5 emakumeak badira, 4 ikasle aukeratuta, sexu berekoakizateko dagoen probabilitatea kalkula ezazu. Eta laurak emakumeak izateko? Eta emakume bakarbat izateko? Eta gutxienez emakume bat izateko?

31.- Pedagogiako ikasketak, fakultate publiko batean egin dituzten ikasleen % 90 lanean hasi da 2 urtepasa baino lehenago. Langabezian daudenetatik, % 20 soldadutzan dago, eta gainerakoak ikasketakosatzen ari dira. Fakultate pribatuetako ikasleak, nahiz eta erdiak izan, % 60 bakarrik kolokatzendira. Nagore Martinez lizentziatua paroan baldin badago, zein da Zorroaga Fakultate pubikoko pasi-loetan ibilitakoa izateko dagoen probabilitatea?

32.- Kaleetan zehar ibiltzen den “mago” horietako batek zera esaten du: Edonoren pentsamendua asmadezakeela. Hau egiaztatzeko ondoko froga ezartzen diogu. Ikasle batek bere eskuan batzuetan 5duroko eta besteetan 20 duroko txanpona gordetzen du. Gure “magoak” asmatu beharko du txan-ponaren balorea. Froga hau hamar aldiz egiten baldin badugu, eta gure magoak zoriz erantzutenbadu, zein da 9 aldiz ondo erantzuteko daukan probabilitatea? eta 8 edo gutxiago asmatzekoa?Esaten dutenez, benetako magoek, normalean 10tik 9 kasutan asmatzen dute. Kasu honetan 6 asma-tu baldin baditu zer da errezagoa, benetako magoa izatea ala zoriz asmatzea?

33.- 100.000 zifra zoriz aukeratzen baditugu, kalkula ezazu 6 zenbakia 9.971 aldiz edo gutxiagotanagertzeko dagoen probabilitatea. Zein da 54.000 zifra bikoitz lortzeko probabilitatea?

Emaitza: -52.77

34.- Dado bat eta bi txanpon airera botatzen ditugu. Izan bedi X aldagaia “txanponetan lortu dugun pil--kopurua” eta Y aldagaia “ dadoan lortzen dugun balorea”.

Kalkulatu:

a) X eta Y aldagaien baterako probabilitate-funtzioa.b) E (X) eta Var (X).c) E (2X+Y), Var (X+Y), Var (X-Y), Var (2X+Y).

Emaitzak: 1, 3.5, 0.55,....

154

Page 167: Estatistika teoria eta praktika SPSSWIN erabiliz

35.- X eta Y aldagaien baterako probabilitate-funtzioa ondoko hau baldin bada:

X 0 1 2

Y

–1 0.30 0.10 0.15

0 0.05 0.20 0.20

Kalkulatu: E(X), E(Y), Var(X), Var(Y).

Emaitzak: 1, -0.55, 0.7, 0.25

36.- Izan bedi X aldagaia era honetara definitua: Xen balorea 1 izango da pertsona batek gaia gainditzenbadu eta 0 gai hori ez badu gainditzen. Y aldagaia, ostera, ikasten egin dituen hilabeteak izangodira, 2, 3 eta 4 baloreak hartzen duelarik. Dakizkigun datuak ondoko hauek dira: gaia gainditzekodagoen probabilitatea 0.70 da. Ikasten 4 hilabete egiten dutenak 2 hilabete egiten dutenen bikoitzada. Y aldagaien itxaropen matematikoa 3.3 dela ere badakigu. Gaia gainditu eta 3 hilabete ikastenegiten dutenak % 4 dira, eta azkenik bi hilabete ikasten egiten dutenetatik gaia ez du gainditzen %70ek. Datu hauek jakin ondoren baterako probabilitate-funtzioa kalkulatu.

37.- Test batek 8 galdera dauzka. Galdera bakoitzak 5 erantzun posible ditu, eta hauetatik bi baliagarriakdira. Pertsona batek test guztia galderak begiratu gabe erantzuten badu, kalkulatu ondoko gertaerenprobabilitateak:

a) 7 item ondo erantzutekoa.b) 6 item edo gehiago ondo erantzutekoa.c) 3 item edo gutxiago gaizki erantzutekoa.

Aurreko gertaeren probabilitateak kalkulatu 5 erantzun posibleetatik hiru baliagarriak diren kasuan.

Emaitzak: 0.0079, 0.0499, 0.17380.0896, 0.3154, 0.5941

38.- Froga objektibo bat k galderarekin osatuta dago. Galdera bakoitzak 4 erantzun posible ditu, etahauetatik bat baliagarria da. Badakigu pertsona batek test hau zoriz betetzen badu 4 galdera ondoegiteko daukan probabilitatea 0.0577 dela, kalkulatu behar duzuna pasatutako testak zenbat galde-ra dituen izango da.

Emaitza: 7

39.- Demagun talde batean gizonezkoen portzentaia emakumezkoen hirukoitza dela. 5 pertsona daudentalde bat hartzen badugu eta talde hau zoriz osatuta baldin badago, ondorengo gertaeren probabili-tateak kalkulatu:

a) denak sexu berekoak izatekoa.b) hiru lehenengoak gizonak eta bi azkenak emakumeak izatekoa.c) hiru gizon eta bi emakume izatekoa.

Emaitzak: 0.2383, 0.0263, 0.2637

40.- Ikasle batek, Estatistika gaia gainditzeko daukan probabilitatea 0.70 da. Azterketa batera, euskarataldeko 6 ikasle aurkezten badira, kalkulatu ondoko gertaeren probabilitateak:

a) Denek gainditzekoa.b) 6 baino gutxiagok gainditzekoa.c) Inork ez gainditzekoa.d) Zein da aldagai honen itxaropen matematikoa?

Emaitzak: 0.1176, 0.8824, 0.0007, 4.2

155Probabilitatea eta probabilitate-banaketak

Page 168: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 169: Estatistika teoria eta praktika SPSSWIN erabiliz

5. BANAKETA NORMALA ETA NORMALEAN OINARRITUTAKOAK

5.1. BANAKETA NORMALA

5.1.1. Aldagaien tipifikazioa

5.1.2. Taulen erabilpenerako adibideak

5.1.3. Normalaren bidez, banaketa binomialen hurbilketa

5.2. BANAKETA NORMALEAN OINARRITUTAKO BANAKETAK

5.2.1. Ji karratuaren banaketa

5.2.2. Student-en t banaketa

5.2.3. Snedeckor-en F banaketa

5.3. ARIKETAK

Page 170: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 171: Estatistika teoria eta praktika SPSSWIN erabiliz

159

5. BANAKETA NORMALA ETA NORMALEAN OINARRITUTAKOAK

Aurreko gaian, probabilitatea eta probabilitate-banaketak aztertu ditugu. Hauen artean, banaketa bino-miala ikusi dugu. Baina, aipatzen genuen bezala, banaketa binomiala aldagai diskretuei bakarrik egoki-tzen zaio. Gai honetan banaketa jarraiak aztertuko ditugu, eta hauen artean, bereziki, banaketa normala.

Banaketa jarraiak aldagai jarraiei dagozkienak dira.

Probabilitateak kalkulatzeko era, banaketa diskretuetan erabilitakoetatik erabat ezberdina izango da.Hau da bi banaketa-moten arteko ezberdintasunik garrantzitsuena. Bigarren ezberdintasuna honakoaizango da: banaketa diskretuetan puntu edo balio konkretuen probabilitateak kalkulatzea posible izangodela, hau da, lehengo adibideetan zenbait probabilitate era honetara kalkulatu ditugu: zein da 6 pil lor-tzeko dagoen probabilitatea? Banaketa jarraietan honelako galderek ez dute zentzurik eta, ondorioz, bereprobabilitatea 0 izango da. Zentzurik ez duela esan dugu, zeren eta edozein aldagai jarrai hartzen badu-gu, adibidez pertsona baten pisua, ez dago munduan 70 kiloko pertsonarik. Ondo ulertu hau! Guk asko-tan esaten dugu pertsona batek pisu hori duela, baina matematikoki hartuta hau ez da benetako pisurakohurbilketa bat besterik. Gertatzen dena hau da, pisua neurtzeko erabiltzen dugun tresnak askotan ezdituela gramoen zatitxoak bereizten eta gure tresnaren bidez hurbilketa bat egiten dugula.

Banaketa jarraietan ez dugu puntuen probabilitatea kalkulatuko tarteen probabilitatea baizik.

Lehen esan dugu banaketa jarraiak aldagai jarraiei dagozkienak direla, baina askotan, batez ere pro-babilitateen hurbilketak egiterakoan, aldagai diskretuen probabilitateak ere banaketa jarraiak erabiliz kal-kulatuko ditugu.

Banaketa jarraien probabilitateak, tauletara joan nahi ez badugu, integralen bidez kalkulatuko ditugu.Guk gai honetan kalkulu guztiak taularen bidez egingo ditugu, gero paketeak emango dituen balioak tau-letako probabilitateekin konparatzea posible izango delako.

Gai honen atzean, galdera zuzen bat dago. Zergatik banaketa jarraiak? Eta, bereziki, zergatik banake-ta normala? Galdera hau oso egokia izanik, hurrengo gaian aztertuko da sakonki. Hemen, labur-laburesan daitekeena, honakoa da: giza zientzietan erabiltzen diren aldagai jarrai askok (ia gehienak) banake-ta normala jarraitzen dutela. Adimena, errendimendu eskolarra, altuera, pisua,..., aldagaiak, banaketanormalari jarraitzen diote.

Beraz, goazen banaketa normalaren propietateak aztertzera eta, banaketa honetaz baliatuz, probabi-litateak nola kalkulatzen diren ikustera.

5.1. BANAKETA NORMALA

Banaketa jarraien deskribapena egiterakoan, banaketa normalarekin hasiko gara, denetan garrantzitsuenabera baita.

Banaketa normala, banaketa binomialaren hurbiltze gisa sortu zen, eta lehenengo definizioa DeMoivrek eman zuen 1733. urtean. Baina benetako garrantzia XIX. mendean hartu zuen GAUSS etaLAPLACE-k gaur ezagutzen diren formulak aurkeztu zituztenean, nahiz eta formula hauetako batzuk DeMoivre-k argitu zituen formulen berdinak izan. Batzuetan banaketa normala GAUSS-LAPLACE-ren bana-keta izenarekin ere ezagutzen da.

Lehen esan den bezala, banaketa normala banaketa binomialen probabilitateak kalkulatzeko sortuzen. Denborarekin gehien erabiltzen zen banaketa bihurtu zen eta horretan jarraitzen du. Hau dela eta,liburu honetan, nik ere, garrantzi berezia eman diot. Banaketa eta kurba honen propietateak aztertukoditugu orain.

Page 172: Estatistika teoria eta praktika SPSSWIN erabiliz

Banaketa normala adierazten duen kurbak beti forma bera izango du, ondoren agertzen den irudiarenantzekoa. Aldatzen direnak parametroen balioak izango dira; beraz, parametroen arabera, nahi dugunbeste banaketa normal egongo dira.

.– Edozein banaketa normal bi parametrok definituko dute: batezbestekoak eta desbideratze tipikoak.Banaketa normal bat izendatzeko, honela idatziko dugu N(μ,σ), μ batezbestekoa eta σ desbideratzetipikoa adierazten duten parametroak direla.

.– Probabilitate-funtzioak, bere balio handiena batezbestekoan lortzen du. Eta batezbestekotik hurrun-tzen den neurrian altuera gutxitzen doa. Azkenean mutur bietan 0ra hurbiltzen doa, abzisa ardatza-rekin asintotikoa izanik.

.– Banaketa normalaren kurba, batezbestearekiko simetrikoa da.

.– Batezbestekoa, moda eta medianaren balioak edozein banaketa normaletan berdinak izango dira.

Lehen esan dugunez, batezbestekoaren eta desbideratze tipikoaren balioen arabera, kurba normalezberdinen kopurua infinitua izango da.

Ezinezkoa izango litzateke banaketa normal guztien taula dagokiona edukitzea. Honen ondorioz, pro-babilitateak kalkulatzerakoan beti BANAKETA NORMAL TIPIKOAri begiratuz lortuko ditugu.

BANAKETA NORMAL TIPIKOA, batezbestekoa 0 eta desbideratze tipikoa 1 duenari deituko diogu.Hurrengo orrialdeetan aurkezten ditugun taulak banaketa honi dagozkio. Banaketa hau era honetara ida-tziko dugu N(0,1), eta hemendik aurrera Z letra erabiliko dugu banaketa normal tipiko hau adierazteko.

Kontuan hartu behar dugu, banaketa normal tipikoen propietate garrantzitsuena kurba eta abzisa arda-tzen artean gelditzen den zatiaren azalera 1 izatea dela. Orduan batezbestekotik ezkerretara gelditzenden azalera 0.50 izango da, eta batezbestekotik eskuinera gelditzen den zatiarena ere 0.50ekoa izangoda.

5.1.1. Aldagaien tipifikazioa

Lehen esan dugunez, banaketa normal guztiak baliokideak dira. Puntuen arteko baliokidetasun hauek lor-tzeko bi prozesu ezberdin ikusiko ditugu.

Edozein banaketa normalen balioari, banaketa normal tipikoan N(0,1) dagokion puntuazioa kalkula-tzen saiatuko gara lehen kasu honetan.

Demagun banaketa normal baten X aldagaia daukagula, eta gure aldagaien parametroak 100 eta 15direla. Honek, Xen batezbestekoa 100 eta desbideratze tipikoa 15 direla esan nahi du. Hau adieraztekohonela idatziko dugu: X → N (100,15).

160

Page 173: Estatistika teoria eta praktika SPSSWIN erabiliz

X aldagaiaren balio batzuk badauzkagu, eta puntu hauei, banaketa normal tipikoan, N(0,1)ean, dagoz-kion puntuazioak lortu nahi baditugu, ondoko bi pauso hauek eman beharko ditugu: lehenengoan, oina-rrizko balioei aldagaien batezbestekoa kenduko diegu eta, bigarren pausoan, lortutako emaitza zati des-bideratze tipikoa egingo dugu.

Aipatutako pausoak formula honen bidez egingo ditugu:

X – μZ = –––––––––

σ

N(100,15) banaketako puntu bat tipifikatu nahi badugu, ondoko aldaketa hau egingo dugu:

X – 100Z = –––––––––

15

Hau da, pertsona batek N(100,15) banaketari jarraitzen dion X aldagaian 118 puntu lortu baldin badi-tu, puntuazio honi dagokion puntuazio tipikoa kalkulatzeko:

X – 100 118 – 100Z = ––––––––––– = ––––––––––– = 1.20

15 15

Beraz, 118 balioari dagokion puntuazio tipikoa 1.20 da (118 eta 1.20 baliokideak dira).

Prozesu honi aldagaiaren TIPIFIKAZIO-prozesu deituko diogu.

Batzuetan kontrako prozesua interesatuko zaigu, hau da, normal tipikoan emandako puntuazio batiedozein banaketa normaletan dagokion balioa bilatzea. Prozesu honi DESTIPIFIKAZIO-prozesu deitukodiogu. Honen prozesua tipifikazioaren kontrakoa da. Beraz, Z puntuazio tipiko baten baliokidea besteedozein banaketari N (μ,σ) jarraitzen zaion X aldagai batean kalkulatu nahi badugu, prozesua honakoaizango da:

X = σ * Z + μ

Z puntuazio tipiko bat, N (50,7) banaketari dagokion beste X batean aldatu nahi badugu, honako alda-keta egingo dugu:

X = 7 * Z + 50

Hemendik, 1.17 puntuazio tipikoaren baliokidea, N(50,7) banaketan kalkulatzeko:

X = 7 * 1.17 + 50 = 8.19 + 50 = 58.19

5.1.2. Taulen erabilpenerako adibideak

Banaketa normalaren taulei bi ikuspuntu ezberdin edota osagarritatik begira diezaiekegu.

Lehenengo kasuan, aldagai baten BALIOA EMANDA balio hau baino handiagoak edo txikiagoak dire-nen portzentaia edo probabilitatea kalkulatzeko erabil dezakegu. Kasu honetan, emandako puntuen azpi-tik edo gainetik geratzen den zatien azalera kalkulatu beharko dugu. Puntua ezagutzen dugunez, bada-kigu gure probabilitatea zein zutabe eta zein lerrotan aurkituko dugun.

Bigarrena, alderantzizkoa izango litzateke, probabilitatea edo azalera badakigu, eta kalkulatu beharduguna zera da: zein da ezkerrera edo eskuinera gelditzen den azalera emandakoa duen puntuak. Kasuhonetan badakigu zein den gure probabilitatea, eta zein zutabe eta zein lerrotan dagoen begiratu behar-ko dugu.

Banaketa normal tipikoen taulak erabiliz, adibide batzuk aztertuko ditugu.

161Banaketa normala eta ondoriozkoak

Page 174: Estatistika teoria eta praktika SPSSWIN erabiliz

1.- Zein da Z=1.27 puntuazio tipikoak bere ezkerrera uzten duen probabilitatea? Galdera honekin eska-tzen dena hau da: puntu hau baino txikiagoak izateko dagoen probabilitatea zein den. (Eskatzenduguna ilundutako zatiaren azalera edo puntu batek zati honetan egoteko duen probabilitatea da).

Galdera honen erantzuna taulak zuzenean ematen digu, Z=1.27 balioari dagokion balioa aurkituz.Balio hau aurkitzeko, 1.2ren lerroa hartu beharko dugu, .07ri dagokion zutabean, eta hor ikusiko dugunbalioa .8979 izango da. Hau da guk egin dugun galderaren erantzuna. Honek 1.27 puntu baino gutxia-go lortzeko probabilitatea .8979 dela esan nahi du.

2.- Zein da banaketa normal tipikoari jarraitzen zaion Z aldagaiak, -0.64 eta 1.53 balioen artean egote-ko duen probabilitatea? (Kasu honetan ere ilundutako zatiaren azalera, edo puntu batek zati horretanegoteko duen probabilitatea jakin nahi dugu).

Kasu honetan balio hauen artean gelditzen den zatien azalera kalkulatu behar dugu. Horretarako1.53tik ezkerretara gelditzen den azalera kalkulatuko dugu eta probabilitate edo azalera honi, -0.64tikezkerretara gelditzen den azalera edo probabilitatea kenduko diogu.

Probabilitate edo azalera hauek tauletatik zuzenean lortuko ditugu, eta emaitzak hauek dira:

1.53tik ezkerretara : .9369

-0.64tik ezkerretara : .2611

Bi balioen arteko azalera edo probabilitatea:

.9369 – .2611 = .6758

3.- Zein da banaketa normal tipiko bateko puntua, bere gainetik % 72 uzten duena? (Kasu honetan ilun-dutako zatiaren azalera ezagutzen dugu: 0.72, eta galdera-hasieran aipatutako puntua zein den jakinnahi dugu).

162

Page 175: Estatistika teoria eta praktika SPSSWIN erabiliz

Adibide hau, aurreko kasuen kontrakoa izango da, hau da, lehen kalkulatu dugun probabilitatea puntubatetik ezkerretara gelditzen zena zen. Kasu honetan puntu bat baino handiagoak zenbat diren kalkulatubehar dugu, hau da, eskuinetara gelditzen den portzentaia edo probabilitatea. Baina ezberdintasun haugarrantzizkoa izanik ere, ez da kasu honetan inportanteena, orain komentatuko duguna baizik. Orain arteegin ditugun bi adibideetan, puntua ezaguna zen eta kalkulatzen genuena probabilitatea zen. Kasu hone-tan, ostera, dakiguna probabilitatea da eta kalkulatu behar duguna puntua izango da.

Puntu batetik eskuinera gelditzen den probabilitatea .72 baldin bada, puntu honetatik ezkerretara gel-ditzen dena .28koa da, bien arteko batura 1 baita. Orain taulan begiratu beharko dugu .28 probabilitate-ari gehien hurbiltzen zaion probabilitatea zein den jakiteko, eta probabilitate hau aurkitu ondoren zeinlerro eta zein zutabetan dagoen jakiteko. Gure kasuan, gehien hurbiltzen den probabilitatea .2810 da, eta-0.5 lerroan eta 0.08 zutabean dago. Beraz, bilatzen genuen puntua -0.58 da.

4.- Zenbat balio du koartilarteko ibiltarterdiak banaketa normal N(0,1) tipiko batean? (P75 eta P25enarteko distantzien erdia kalkulatu nahi dugu).

Gogora dezagun koartilarteko ibiltarterdia Q3 eta Q1en arteko tartearen luzeraren erdia dela. Hau da,gure ibiltarterdien luzera kalkulatzeko, Q3 eta Q1 kalkulatu beharko ditugu lehen pausoan, eta hortikerraz lortuko dugu ibiltarterdia. Q3ren balioa kalkulatzeko, kontuan hartu beharra daukagu, puntu honekbere ezkerretara uzten duen probabilitatea .75 dela, eta Q1ek uzten duena .25 izango dela. Ezaguna da,Q3tik batezbestekora eta Q1etik batezbestekorako distantziak berdinak direla ere, puntu hauek simetri-koak baitira. Beraz, gure kasuan nahikoa izango da bietatik bat kalkulatzea, besteen balioa berdina izan-go baita, baina zeinua aldatuta.

Q3 puntua zein den jakiteko tauletan begiratu behar duguna honakoa da: .7500ri gehien hurbiltzenzaion probabilitatea zein lerro eta zutabetan dagoen. Gure kasuan gehien hurbiltzen den probabilitatea.7485 da eta 0.6ren lerroan dago .07ren zutabean. Beraz, bilatzen dugun puntua 0.67 izango da, hau daQ3=0.67, eta honen ondorioz, Q1 = -0.67 izango da.

Hemendik koartilarteko ibiltarterdia:

Q3 – Q1 0.67 – (–0.67)––––––––––– = –––––––––––––– = 0.67

2 2

163Banaketa normala eta ondoriozkoak

Page 176: Estatistika teoria eta praktika SPSSWIN erabiliz

5.- Zein da N(15,6) banaketa normalari jarraitzen zaion aldagai batek 12.7 baino puntuazio handiagoakhartzeko dagoen probabilitatea? (Ilunduta dagoen zatiaren probabilitatea kalkulatu nahi dugu).

N (15,6) banaketa normalaren taularik ez daukagu. Beraz N(0,1) banaketaren taulak erabiliz kalkula-tu beharko dugu gure probabilitatea, eta horretarako lehenengo pausoa N(15,6) banaketan emanda dago-en 12.7 puntuari banaketa tipikoan dagokion puntuazioa kalkulatzea izango. 12.7 puntuari dagokionpuntuazioa lortzeko, nahikoa da gure puntuazioa tipifikatzea, beraz hau da egingo duguna:

12.7 – 15Z = ––––––––––– = – 0.38

6

Eskatzen genuen probabilitatea, hau da, 12.7 puntu baino gehiago edukitzea, eta banaketa normaltipikoan -0.38 puntu baino gehiago edukitzea berdinak izango dira. -0.38 baino gehiago edukitzeko pro-babilitatea zein den jakiteko, lehenengo gutxiago izatekoa zein den kalkulatuko dugu, eta hortik 1erainofalta dena izango da gu bilatzen ari garen probabilitatea. Hau da, lehenengo, puntutik ezkerretara geldi-tzen den zatiaren azalera kalkulatuko dugu eta gero, 1eraino falta dena izango da ilundutako zatiarenazalera.

- 0.38 baino txikiagoa izateko dagoen probabilitatea, tauletatik zuzenean lortuko dugu, -0.3 lerroaneta .08 zutabean agertzen dena baita: 0.3520.

Beraz, -0.38 baino handiagoa izateko dagoen probabilitatea:

1 – 0.3520 = 0.6480 izango da.

Hemendik 12.7 puntu baino gehiago lortzeko dagoen probabilitatea 0.6480 izango dela esan deza-kegu.

6.- Zein da N(15,6) banaketa normalari jarraitzen zaion aldagai baten puntuazioak 6.4 eta 19.5en tarteanegoteko duen probabilitatea? (Irudian ilunduta agertzen den zatiaren probabilitatea edo azalera).

164

Page 177: Estatistika teoria eta praktika SPSSWIN erabiliz

Aurreko kasuan bezala, probabilitatea kalkulatu nahi dugun tartearen bi muturrak tipifikatuko ditugu,beren baliagarriak banaketa normal tipikoan lortzeko. Gure kasuan:

19.5 – 15 6.4 - 15Z = –––––––––– = 0.75 Z = –––––––––– = –1.43

6 6

Balio tipifikatuak ezagutu ondoren, tauletan begiratuz probabilitatea kalkula dezakegu:

0.75tik ezkerretako probabilitatea : 0.7733

-1.43tik ezkerretako probabilitatea: 0.0764

Tartearen probabilitatea : 0.7733 - 0.0764 = 0.6969

Beraz, eskatutako probabilitatea, eta orain kalkulatu dugun tarte honen probabilitateak berdinak dire-nez geroz, eskatutako probabilitatea 0.6969 izango da.

7.- Zein da N(15,6) banaketa normalari jarraitzen zaion X aldagai baten puntua, bere eskuineko aldean% 65 uzten duena? (Eskuineko zatiaren azalera ezaguna da eta puntua zein den kalkulatu nahi dugu).

Kasu honetan ere taularik ez daukagu, baina banaketa normal tipikoan jakin dezakegu probabilitatehau bere eskuinetara uzten duen puntua zein den. Tauletan agertzen diren probabilitateak, beti puntue-tatik ezkerretara gelditzen direnak izango dira. Hala ere probabilitatearen batuketa orokorra 1 dela jaki-nik, ezkerreko probabilitatea 1-p izango da (ezkerreko aldera): 1 - 0.65 = 0.35.

Horrela bada N(0,1) taulan ezkerrera % 35 uzten duen puntua -0.39 dela ikus dezakegu, hau da,puntu honek bere eskuinera % 65 uzten du.

Baina puntu hau banaketa normal tipikoari dagokiona da, eta gure banaketako baliagarria lortzekopuntu hau destipifikatu beharrean aurkitzen gara. Lehen aipatutako formula erabiliko dugu:

X = σ * Z + μ

Gure kasuan, N(15,6) banaketara pasatzeko:

X = 6 * (-0.39) + 15 = 12.66

Beraz, gure puntua 12.66 izango da.

8.- X aldagai N(15,6) banaketa normalari jarraitzen bazaio, zenbat balio du aldagai honen koartilartekoibiltarterdiak? (4. kasuan bezala P75 eta P25en arteko tartearen erdia zein den kalkulatu nahi dugu).

1. eta 3. mailako koartilak kalkulatu behar ditugu, beren arteko diferentzien erdia jakiteko.

165Banaketa normala eta ondoriozkoak

Page 178: Estatistika teoria eta praktika SPSSWIN erabiliz

Badakigu Q1=-0.67 eta Q3=0.67 direla banaketa normal tipikoen kasuan, eta gure banaketa norma-leko balioak kalkulatzeko nahikoa izango da balio hauek destipifikatzea, eta lortutako emaitzak hauekdira:

Q1 = 6 * (-0.67) + 15 = 10.98

Q3 = 6 * ( 0.67) + 15 = 19.02

Hemendik, koartilarteko ibiltarterdiaren balioa atera dezakegu, ondoko formula erabiliz:

Q3 – Q1 19.02 – 10.98Q = ––––––––– = –––––––––––––– = 4.02

2 2

Banaketa normal tipikoko ibiltarterdi eta gure banaketakoen arteko erlazioa eta desbideratze tipikoenarteko erlazioak berdinak direla ikus dezakegu, hau da, gure banaketako desbideratze tipikoa 6 denez,gure banaketa, banaketa tipikoa baino 6 aldiz sakabanatuagoa dela esan dezakegu, eta proportzioa ber-dina da koartilarteko ibiltarterdiekin ere. Banaketa tipikoen kasuan 0.67 zen eta kasu honetan 4.02, etaikus dezakeguna hau da: bien arteko zatidura 6 dela.

5.1.3 Normalaren bidez, banaketa binomialen hurbilketa

Atal honen hasieran aipatu dugu, banaketa binomialaren probabilitateen hurbilketa lortzea izan zelabanaketa normalaren jatorria. Ikus dezagun hurbilketa hau nola egiten den.

Demagun txanpon bat 100 aldiz airera botatzen dugula, eta kasu bakoitzean pil lortzeko dagoen pro-babilitatea 0.50 dela. Demagun ondoko bi probabilitate hauek kalkulatu nahi ditugula: 45 pil bainogutxiago lortzeko dagoen probabilitatea eta, bigarren kasuan, zehazki 45 pil lortzeko dagoen probabili-tatea.

Normalean probabilitate hauek banaketa binomialaren taulak erabiliz kalkulatuko genituzke bainataula egokirik ez dugu lortuko, gehienez N =30ekoak izaten baitira. Ondorioz, hurrengo pausoan Poisso-nen banaketaren bidez saiatuko gara probabilitate hau kalkulatzen, non m = N*p izango zen. Kasu hone-tan, m = 100*0.50 = 50 izango da eta Poissonen taularik ere ez dugu edukiko. Beraz, gelditzen zaigunaukera bakarra probabilitate hau banaketa normalaren bidez kalkulatzea izango da.

Baina hurbilketa hau banaketa normalaren bidez egiteko, batezbestekoaren eta desbideratze tipikoa-ren balioak ezagutu beharko ditugu.

Badakigu edozein banaketa binomialen batezbestekoa N*p dela, bariantza σ2 = N * p * (1-p) izangodelarik.

Gure adibidean, μ = 100 * 0.50 = 50 eta σ2 = 100*0.50*0.50 = 25. Hemendik, desbideratze tipikoa= 5, bariantzaren erro karratua baita.

166

Page 179: Estatistika teoria eta praktika SPSSWIN erabiliz

Banaketa normalen parametroak berdinak dira, hau da, gure probabilitateak kalkulatzeko erabilikodugun banaketa normala N (50,5) izango da.

Eskatutako lehen probabilitatea 45 pil baino gutxiago lortzea da, hau da, 44 edo gutxiago lortzea.

Banaketa diskretutik banaketa jarraira pasatzeko zuzenketa bat egin behar dugu. Kontuan hartu behardugu banaketa binomialean, hau da, txanpona airera botatzen dugunean ezin dezakegula 44.5 pil lortu.Ez du zentzu handirik era honetako hitzak erabiltzeak. Ostera, banaketa jarraian bai. Hau dela eta, bana-keta normalaz hitz egitean, 44 edo gutxiago lortzeko probabilitatea, 44.5 baino gutxiagogatik aldatukodugu, eta balio honekin kalkulatuko dugu gure probabilitatea.

Kalkulu-prozesua aurreko adibideetan erabilitakoa bera izango da. Lehenengo, balio hau tipifikatuegin beharko dugu:

44.5 – 50Z = –––––––––– = –1.1

5

Eta eskatutako probabilitatea, - 1.1 banaketa tipikoko puntutik ezkerretara dagoen probabilitatea izan-go da. Hau tauletatik lortuko dugu eta 0.1357 da, eta aipatu dugun lehenengo gertaeraren probabilitateaizango da.

Bigarren probabilitatea kalkulatzeko gauza bera egingo dugu, baina 45 pil lortzeko probabilitateakalkulatu beharrean 44.5 pil baino gehiago eta 45.5 baino gutxiago lortzeko probabilitatea kalkulatukodugu, irudian ikusten den bezala. Aldaketa honen arazoa lehen aipatu duguna da. Txanpona airera bota-tzen dugunean 43, 44, 45,...pil lor dezakegu. Hau banaketa diskretua da, eta guk, probabilitateak, bana-keta jarraia erabiliz kalkulatuko ditugu. Hau egin ahal izateko, aipatutako eraldaketa egin beharko dugu.Beraz, kalkulatuko dugun probabilitatea, 44.5 baino gehiago eta 45.5 baino gutxiago lortzeko probabili-tatea izango da.

Bi balio hauek tipifikatu eta taularen bidez probabilitatea lortuko dugu:

44.5 tipifikatuta -1.1 lortzen dugu eta honi dagokion probabilitatea, taulan begiratuta, 0.1357 da.

45.5 tipifikatzen badugu -0.9 lortzen dugu eta honi dagokion probabilitatea, taulan begiratuta, 0.1841da.

Eskatutako probabilitatea 0.1841- 0.1357 = 0.0484 da.

Ondoren banaketa normalaren taulak azaltzen ditugu, bi zatitan banatuta, balio positiboentzat etabalio negatiboentzat. Balio positiboentzakoak 0.5000 baino probabilitate handiagoak ematen dizkigu betieta balio negatiboenak berriz 0.5000 baino txikiagoak.

Z balioak, abzisa ardatzeko balioak izango dira, eta p probabilitateak.

167Banaketa normala eta ondoriozkoak

Page 180: Estatistika teoria eta praktika SPSSWIN erabiliz

BANAKETA NORMAL TIPIKOEN TAULA N(0,1)(Balio POSITIBOENTZAT)

Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09

0.0 .5000 .5039 .5079 .5119 .5159 .5199 .5239 .5279 .5318 .5358

0.1 .5398 .5438 .5476 .5517 .5556 .5596 .5635 .5674 .5714 .5753

0.2 .5792 .5831 .5870 .5909 .5948 .5987 .6025 .6064 .6102 .6140

0.3 .6179 .6217 .6255 .6293 .6330 .6368 .6405 .6443 .6480 .6517

0.4 .6555 .6591 .6627 .6664 .6700 .6736 .6772 .6808 .6843 .6879

0.5 .6914 .6949 .6984 .7019 .7045 .7088 .7122 .7156 .7190 .7224

0.6 .7257 .7290 .7323 .7356 .7389 .7421 .7453 .7485 .7517 .7549

0.7 .7580 .7611 .7642 .7673 .7703 .7733 .7763 .7793 .7823 .7852

0.8 .7881 .7910 .7938 .7967 .7995 .8023 .8051 .8078 .8107 .8132

0.9 .8159 .8185 .8212 .8238 .8263 .8289 .8314 .8339 .8364 .8389

1.0 .8413 .8437 .8461 .8485 .8508 .8531 .8554 .8576 .8599 .8621

1.1 .8643 .8665 .8686 .8707 .8728 .8749 .8769 .8790 .8810 .8829

1.2 .8849 .8868 .8887 .8906 .8925 .8943 .8961 .8979 .8997 .9014

1.3 .9032 .9049 .9065 .9082 .9098 .9114 .9130 .9146 .9162 .9177

1.4 .9192 .9207 .9222 .9236 .9250 .9264 .9278 .9292 .9305 .9318

1.5 .9331 .9344 .9357 .9369 .9382 .9394 .9406 .9417 .9429 .9440

1.6 .9452 .9463 .9473 .9484 .9495 .9505 .9515 .9525 .9535 .9544

1.7 .9554 .9563 .9572 .9581 .9590 .9599 .9608 .9616 .9624 .9632

1.8 .9640 .9648 .9656 .9663 .9671 .9678 .9685 .9692 .9699 .9706

1.9 .9712 .9719 .9725 .9732 .9738 .9744 .9750 .9755 .9761 .9767

2.0 .9772 .9777 .9783 .9788 .9793 .9798 .9803 .9807 .9812 .9816

2.1 .9821 .9825 .9830 .9834 .9838 .9842 .9846 .9850 .9853 .9857

2.2 .9861 .9864 .9867 .9871 .9874 .9877 .9880 .9884 .9887 .9889

2.3 .9892 .9895 .9898 .9901 .9903 .9906 .9908 .9911 .9913 .9915

2.4 .9918 .9920 .9922 .9924 .9926 .9928 .9930 .9932 .9934 .9936

2.5 .9937 .9939 .9941 .9943 .9944 .9946 .9947 .9949 .9950 .9952

2.6 .9953 .9954 .9956 .9957 .9958 .9959 .9960 .9962 .9963 .9964

2.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9972 .9973

2.8 .9974 .9975 .9976 .9976 .9977 .9978 .9978 .9979 .9980 .9980

2.9 .9981 .9981 .9982 .9983 .9983 .9984 .9984 .9985 .9985 .9986

Beste probabilitate batuk:z

3.0 .99865 3.5 .99976744.0 .9999683 4.5 .99999665.0 .9999997

168

Page 181: Estatistika teoria eta praktika SPSSWIN erabiliz

BANAKETA NORMAL TIPIKOEN TAULA N(0,1)(Balio NEGATIBOENTZAT)

Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09

–0.0 .5000 .4961 .4921 .4881 .4841 .4801 .4761 .4721 .4682 .4642

–0.1 .4602 .4562 .4524 .4483 .4444 .4404 .4365 .4326 .4286 .4247

–0.2 .4208 .4169 .4130 .4091 .4052 .4013 .3975 .3936 .3898 .3860

–0.3 .3821 .3783 .3745 .3707 .3670 .3632 .3595 .3557 .3520 .3483

–0.4 .3445 .3409 .3373 .3336 .3300 .3264 .3228 .3192 .3157 .3121

–0.5 .3086 .3051 .3016 .2981 .2955 .2912 .2878 .2844 .2810 .2776

–0.6 .2743 .2710 .2677 .2644 .2611 .2579 .2547 .2515 .2483 .2451

–0.7 .2420 .2389 .2358 .2327 .2297 .2267 .2237 .2207 .2177 .2148

–0.8 .2119 .2090 .2062 .2033 .2005 .1977 .1949 .1922 .1893 .1868

–0.9 .1841 .1815 .1788 .1762 .1737 .1711 .1686 .1661 .1636 .1611

–1.0 .1587 .1563 .1539 .1515 .1492 .1469 .1446 .1424 .1401 .1379

–1.1 .1357 .1335 .1314 .1293 .1272 .1251 .1231 .1210 .1190 .1171

–1.2 .1151 .1132 .1113 .1094 .1075 .1057 .1039 .1021 .1003 .0986

–1.3 .0968 .0951 .0935 .0918 .0902 .0886 .0870 .0854 .0838 .0823

–1.4 .0808 .0793 .0778 .0764 .0750 .0736 .0722 .0708 .0695 .0682

–1.5 .0669 .0656 .0643 .0631 .0618 .0606 .0594 .0583 .0571 .0560

–1.6 .0548 .0537 .0527 .0516 .0505 .0495 .0485 .0475 .0465 .0456

–1.7 .0446 .0437 .0428 .0419 .0410 .0401 .0392 .0384 .0376 .0368

–1.8 .0360 .0352 .0344 .0337 .0329 .0322 .0315 .0308 .0301 .0294

–1.9 .0288 .0281 .0275 .0268 .0262 .0256 .0250 .0245 .0239 .0233

–2.0 .0228 .0223 .0217 .0212 .0207 .0202 .0197 .0193 .0188 .0184

–2.1 .0179 .0175 .0170 .0166 .0162 .0158 .0154 .0150 .0147 .0143

–2.2 .0139 .0136 .0133 .0129 .0126 .0123 .0120 .0116 .0113 .0111

–2.3 .0108 .0105 .0102 .0099 .0097 .0094 .0092 .0089 .0087 .0085

–2.4 .0082 .0080 .0078 .0076 .0074 .0072 .0070 .0068 .0066 .0064

–2.5 .0063 .0061 .0059 .0057 .0056 .0054 .0053 .0051 .0050 .0048

–2.6 .0047 .0046 .0044 .0043 .0042 .0041 .0040 .0038 .0037 .0036

–2.7 .0035 .0034 .0033 .0032 .0031 .0030 .0029 .0028 .0028 .0027

–2.8 .0026 .0025 .0024 .0024 .0023 .0022 .0022 .0021 .0020 .0020

–2.9 .0019 .0019 .0018 .0017 .0017 .0016 .0016 .0015 .0015 .0014

Beste probabilitate batzuk:

–3.0 .00135 –3.5 .0002326–4.0 .0000317 –4.5 .0000034–5.0 .0000003

169Banaketa normala eta ondoriozkoak

Page 182: Estatistika teoria eta praktika SPSSWIN erabiliz

5.2. BANAKETA NORMALEAN OINARRITUTAKO BANAKETAK

Ondoren ikusiko ditugun hiru banaketak, banaketa normaleko aldagaietan oinarrituak izango dira.Banaketa hauek garrantzi handikoak dira inferentzia estatistikoan ikusten diren hipotesi-testak erabiltze-ko.

Hauetatik lehenengo ikusiko duguna Ji-karratuaren (X2) banaketa izango da.

5.2.1. X2aren banaketa

X2aren banaketaren iturburua N(0,1)-eko aldagai desberdinetan dago.

Izan daitezela Z1, Z2, Z3,....Zn beren artean aldagai askeak, eta aldagai bakoitza N(0,1) banaketarijarraitzen zaiona. Aldagai aleatorio hauen karratuak batuta lortuko dugun aldagaiak X2 banaketa, naskatasun-graduekin, segituko duela esango dugu.

Hau da, X2n = Z12 + Z22 + Z32 +......+Zn2 N ASKATASUN-GRADUKO JI KARRATUARENBANAKETAri jarraitzen zaio.

Banaketa honi dagokion kurbaren forma hau da:

Banaketa honen dentsitate-funtzioen formula ikertzen ez gara hasiko, honek gure helburuak gaindi-tzen baititu. Hala ere, komenigarri iruditzen zait banaketa honen propietate batzuk aipatzea:

1.- X2aren banaketari jarraitzen zaion aldagai baten batezbestekoa eta bariantza hauek dira

Batezbestekoa: E(X) = n, Bariantza: VAR(X) = 2n.

2.- X aldagaiak n1 askatasun-graduko X2ari jarraitzen bazaio eta Y aldagaiak n2 askatasun-graduko X2arijarraitzen bazaio eta elkarrekiko aldagai askeak badira, X + Y aldagaiak n1+n2 askatasun-gradukoX2ari jarraituko zatzaizkio.

Hau da X → Ji karratua n1 askatasun-graduarekin

Y → Ji karratua n2 askatasun-graduarekin

Eta aldagai biak askeak badira:

X + Y → Ji karratua n1+n2 askatasun-graduarekin

Hurrengo orrialdean aurkezten dugun taulak, alde batetik askatasun-graduen zenbakia eta bestetikprobabilitateak eskaintzen dizkigu, taularen barruan agertzen diren balioak bilatutako balioei dagoz-kionak izanez.

Goiko aldean agertzen diren probabilitateak puntutik eskuinaldean geratzen diren balioei dagozkie,edo bestela esanda, aldagaiak puntu hori baino balio handiagoa lortzeko duen probabilitateari dago-kio.

170

Page 183: Estatistika teoria eta praktika SPSSWIN erabiliz

Horrela, 12 graduko askatasuna duen Ji karratuari jarraitzen zaion aldagai batek 9.03 puntu bainobalio handiagoa lortzeko dagoen probabilitatea jakin nahi badut, era honetara begiratu beharko dut.Lehenengo, 12 graduari dagokion lerroa zein den bilatu beharko dut, eta lerro honetan begiratuko dut9.03 balioa. Balio hau 0.70 zutabean dago. Beraz, eskatutako probabilitatea 0.70 izango da.

15 graduko askatasuna duen, eta Ji karratuari jarraitzen zaion aldagai bateko puntu bat bilatzen badu-gu, bere eskuinera 0.95 probabilitatea uzten duena, era honetara begiratu beharko dugu: kasu hone-tan 15aren lerroan eta 0.95 zutabean aurkituko dugu gure balioa, eta 7.26 izango da hau.

Azkenik, 10 graduko Ji karratuari jarraitzen zaion aldagai bat 4.86 eta 21.16 tartean egoteko dagoenprobabilitatea kalkulatu nahi badugu, bi balio hauei dagozkien probabilitateak kalkulatuko ditugulehenik; balio hauek 0.90 eta 0.02 direla jakin ondoren, puntu bien arteko probabilitatea, lortutako biprobabilitateen kendura izango da, hau da: 0.90 - 0.02 = 0.88.

JI KARRATUEN TAULA

.95 .90 .50 .10 .05 .02 .01 .001

1 .003 .016 .46 2.71 3.84 5.41 6.64 10.832 .10 .21 1.39 4.60 5.99 7.92 9.21 13.823 .35 .58 2.37 6.25 7.82 9.84 11.34 16.274 .71 1.06 3.36 7.78 9.49 11.67 13.28 18.465 1.14 1.61 4.35 9.24 11.07 13.39 15.09 20.526 1.64 2.20 5.35 10.64 12.59 15.03 16.81 22.467 2.17 2.83 6.35 12.02 14.07 16.62 18.48 24.328 2.73 3.49 7.34 13.36 15.51 18.17 20.09 26.129 3.32 4.17 8.34 14.68 16.92 19.68 21.67 27.8810 3.94 4.86 9.34 15.99 18.31 21.16 23.21 29.5911 4.58 5.58 10.34 17.28 19.68 22.62 24.72 31.2612 5.23 6.30 11.34 18.55 21.03 24.05 26.22 32.9113 5.89 7.04 12.34 19.81 22.36 25.47 27.69 34.5314 6.57 7.79 13.34 21.06 23.68 26.87 29.14 36.1215 7.26 8.55 14.34 22.31 25.00 28.26 30.58 37.7016 7.96 9.31 15.34 23.54 26.30 29.63 32.00 39.2917 8.67 10.08 16.34 25.77 27.59 31.00 33.41 40.7518 9.39 10.86 17.34 25.99 28.87 32.35 34.80 42.3119 10.12 11.65 18.34 27.20 30.14 33.69 36.19 43.8220 10.85 12.44 19.34 28.41 31.41 35.02 37.57 45.3221 11.59 13.24 20.34 29.62 32.67 36.34 38.93 46.8022 12.34 14.04 21.34 30.81 33.92 37.66 40.29 48.2723 13.09 14.85 22.34 32.01 35.17 39.97 41.64 49.7324 13.85 15.66 23.34 33.20 36.42 40.27 42.98 51.1825 14.61 16.47 24.34 34.38 37.65 41.57 44.31 52.6226 15.38 17.29 25.34 35.56 38.88 42.86 45.64 54.0527 16.15 18.11 26.34 36.64 40.11 44.14 46.96 55.4828 16.93 18.94 27.34 37.92 41.34 45.42 48.28 56.8529 17.71 19.77 28.34 39.09 44.56 46.69 49.59 58.3030 18.49 20.60 29.34 40.26 43.77 47.96 50.89 59.70

171Banaketa normala eta ondoriozkoak

PK

Page 184: Estatistika teoria eta praktika SPSSWIN erabiliz

5.2.2. Student-en T banaketa

Banaketa normalean oinarritutako bigarren banaketa hau bi aldagaien bidez lortuko dugu, batakN(0,1) banaketa normala du eta bestea X2aren banaketari jarraitzen zaio.

Banaketa hau, bi laginen arteko batezbestekoen konparazioa egiteko erabiltzen da gehienbat.

Bere formula hau litzateke:

non:Z, N(0,1)ri jarraitzen zaion aldagaia den.

X2, n askatasun-graduko X2aren banaketari jarraitzen zaion aldagaia den.

T banaketan ere, askatasun-graduaz hitz egin beharko dugu, eta hauek Ji karratuari jarraitzen zaizkionX aldagaiarekin bat datoz.

Probabilitate- edo dentsitate-formula aztertzen ez gara hasiko. Banaketa hauen bi propietate ikusikoditugu bakarrik:

.– 0 balioa duen batezbestekoarekiko simetrikoa da.

.– Askatasun-graduak handitzen diren neurrian banaketa normalari gehiago hurbiltzen zaizkio, honelaaskatasun-graduak 120 direnean lortzen den hurbilketa oso haundia izanik. Askotan, askatasun--graduak 30 baino handiagoak direnean, kurba normalaren bidez egiten den hurbilketa erabiltzen da.

Taulak erabiltzeko modua

Hurrengo orrian agertzen den T banaketaren taulak, ezkerreko zutabean askatasun-graduak zehaztenditu. Erabili nahi dugun bakoitzean, gure banaketaren askatasun-graduak ikusi beharko ditugu. Taulan osoprobabilitate txikia duten balioak agertzen zaizkigu, hauek izango baitira hipotesi-testetan erabiliko ditu-gun balioak.

Honela, adibidez, 12 askatasun-graduko Student-T bati jarraitzen zaion aldagai bat baldin badugu eta0.99 probabilitateak bere ezkerretara uzten duen puntua jakin nahi badugu, 12 askatasun-graduko lerroaaukeratu beharko dugu eta ondoren 0.99 zutabean begiratuz, behar dugun balioa lortuko dugu. Kasuhonetan 2.6810 izango da.

Aldiz, 20 askatasun-gradu duen aldagai batean, gure aldagaiaren balioa 1.33 baino txikiagoa izatekoprobabilitatea jakin nahi badugu, 20 graduari dagokion lerroan aurkituko dugu balio honi gehien hurbil-tzen zaiona: 1,3253 eta 0.10 zutabean aurkitzen dela ikus dezakegu. Hau izango da aldagaiak 1.33balioa baino lortzeko duen probabilitatea txikiagoa.

T =Z

X nn

2

172

Page 185: Estatistika teoria eta praktika SPSSWIN erabiliz

STUDENT-en T TAULA

.75 .90 .95 .975 .990 .995

1 1.0000 3.0777 6.3138 12.7062 31.8207 63.65742 0.8165 1.8856 2.9200 4.3027 6.9646 9.92483 0.7649 1.6377 2.3534 3.1824 4.5407 5.84094 0.7407 1.5332 2.1318 2.7764 3.7469 4.60415 0.7276 1.4759 2.0150 2.5706 3.3649 4.03226 0.7176 1.4398 1.9432 2.4469 3.1427 3.70747 0.7111 1.4149 1.8946 2.3646 2.9980 3.49958 0.7064 1.3968 1.8595 2.3060 2.8965 3.35549 0.7027 1.3830 1.8331 2.2622 2.8214 3.249810 0.6998 1.3722 1.8125 2.2281 2.7638 3.169311 0.6974 1.3634 1.7959 2.2010 2.7181 3.105812 0.6955 1.3562 1.7823 2.1788 2.6810 3.054513 0.6938 1.3502 1.7709 2.1604 2.6503 3.012314 0.6924 1.3450 1.7613 2.1448 2.6245 2.976815 0.6912 1.3406 1.7531 2.1315 2.6025 2.946716 0.6901 1.3368 1.7459 2.1199 2.5835 2.920717 0.6892 1.3334 1.7396 2.1098 2.5669 2.898218 0.6884 1.3304 1.7341 2.1009 2.5524 2.878419 0.6876 1.3277 1.7291 2.0930 2.5395 2.860920 0.6870 1.3253 1.7247 2.0860 2.5280 2.845321 0.6864 1.3232 1.7207 2.0796 2.5177 2.831422 0.6858 1.3212 1.7171 2.0739 2.5083 2.818823 0.6853 1.3195 1.7139 2.0687 2.4999 2.807324 0.6848 1.3178 1.7109 2.0639 2.4922 2.796925 0.6844 1.3161 1.7081 2.0595 2.4851 2.787426 0.6840 1.3150 1.7056 2.0555 2.4786 2.778727 0.6837 1.3137 1.7033 2.0518 2.4727 2.770728 0.6834 1.3125 1.7011 2.0484 2.4671 2.763329 0.6830 1.3114 1.6991 2.0452 2.4620 2.756430 0.6828 1.3104 1.6973 2.0423 2.4573 2.750031 0.6825 1.3095 1.6955 2.0395 2.4528 2.744032 0.6922 1.3086 1.6939 2.0369 2.4487 2.738533 0.6820 1.3077 1.6924 2.0345 2.4448 2.733334 0.6818 1.3070 1.6909 2.0322 2.4411 2.728435 0.6816 1.3061 1.6896 2.0301 2.4377 2.723836 0.6814 1.3055 1.6883 2.0281 2.4345 2.719537 0.6812 1.3049 1.6871 2.0262 2.4114 2.715438 0.6810 1.3042 1.6860 2.0244 2.4286 2.711639 0.6808 1.3036 1.6849 2.0227 2.4258 2.707940 0.6807 1.3031 1.6839 2.0221 2.4233 2.704541 0.6805 1.3025 1.6829 2.0195 2.4208 2.701242 0.6804 1.3020 1.6820 2.0181 2.4185 2.698143 0.6802 1.3016 1.6811 2.0167 2.4163 2.695144 0.6801 1.3011 1.6802 2.0154 2.4141 2.692345 0.6800 1.3006 1.6794 2.0141 2.4121 2.6896

60 0.6789 1.2957 1.6713 2.0002 2.3898 2.660280 0.6779 1.2918 1.6639 1.9901 2.3741 2.6387100 0.6771 1.2903 1.6601 1.9838 2.3652 2.6261200 0.6761 1.2857 1.6532 1.9721 2.3448 2.6012500 0.6751 1.2831 1.6479 1.9650 2.3343 2.5858∞ 0.6742 1.2803 1.6451 1.9600 2.3258 2.5761

173Banaketa normala eta ondoriozkoak

P=N

P

t

Page 186: Estatistika teoria eta praktika SPSSWIN erabiliz

5.2.3. Snedeckor-en F banaketa

Banaketa normalean oinarrituriko hirugarrena, Snedeckor-en banaketa da. Bariantzaren analisian erabil-tzen da eta bi lagineko bariantzak konparatzeko ere bai.

F-ren banaketa honela definituko dugu: Ji karratuari jarraitzen zaizkion bi aldagaien zatiketa da. Xaldagai aleatorio bat izanez (n askatasun-graduko Ji karratu baten arabera banatuta) eta Y beste aldagaialeatorio bat (hau m askatasun-graduko Ji karratuaren banaketari jarraitzen zaiona), ondoren definiturikoF aldagaia, n eta m askatasun-graduko Snedeckor-en banaketari jarraituko zaio.

X / nF = –––––– Snedeckor-en Fn,m-ri jarraitzen zaio.

Y / m

Banaketa honekin lan egitean, askatasun-graduak zehaztu beharko ditugu; bai zenbakitzailearenak,bai zatitzailearenak.

Noski, Snedeckor-en banaketari jarraitzen zaion aldagai batek balio negatiborik ezingo du hartu,X2aren arabera banaturiko aldagai batek balio negatiboak hartu ezin dituen bezala.

Banaketa honen probabilitate- edo dentsitate-funtzioa aztertzen ere ez gara hasiko. Berari dagokionkurbaren itxura ondoko hau da:

Orain, taulak erabiltzeko era bakarrik aztertuko dugu.

Ondoko orrialdean aurkezten dugun taulan aldagaien balioak bakarrik azaltzen ditugu, beren eskui-nera 0.01 eta 0.05 probabilitateak dituztenenak; banaketa hau hipotesi-testetan eta konfiantzako tarteakeraikitzeko erabiltzen baita.

Plantea daitekeen lehen arazoa, 12 eta 7 askatasun-graduko Snedeckor-en F banaketari jarraitzenzaion aldagai baten puntua kalkulatzea da, puntu honek bere eskuinera 0.05eko probabilitatea uztenbaitu.

Puntu hau zenbakitzailean 12 eta zatitzailean 7 graduari dagokion zutabe eta lerroan aurkituko dugu.Hemen bi balio agertzen dira; bata, goikoa, 0.01 probabilitateari dagokiona da eta, bestea, 0.05 proba-bilitateari dagokiona. Beraz, gure puntua 3.5 izango da.

Bigarren arazoa honakoa izan daiteke: 24 eta 10 askatasun-graduko Snedeckor-en F banaketari jarrai-tzen zaion aldagai bateko 4.3 balioak bere eskuinetara uzten duen probabilitatea kalkulatzea. Erantzunalehengo kasuan bezala, 24ri dagokion zutabean eta 10 balioari dagokion lerroan aurkituko dugu, eta kasuhonetan agertzen diren bi balioen gainetik gure balioa agertzen denez, eskatutako probabilitatea .01 izan-go da.

174

Page 187: Estatistika teoria eta praktika SPSSWIN erabiliz

SNEDECKOR-en F BANAKETA

A.G. zenbakitzaileen askatasun-graduakizen pdat 1 2 3 4 5 6 8 12 24 ∞

0.01 405.2 499.9 540.3 562.5 576.4 585.9 597.2 616.0 623.4 636.61 0.05 161.4 199.5 215.7 224.5 230.1 233.9 239 243.9 249.0 254.3

0.10 39.8 49.5 53.5 55.8 57.2 58.2 59.4 60.7 62.0 63.30.20 9.4 12.0 13.0 13.7 14.0 14.2 14.5 14.9 15.2 15.5

0.01 98.4 99.0 99.1 99.2 99.3 99.3 99.3 99.4 99.4 99.52 0.05 18.5 19.0 19.1 19.2 19.3 19.3 19.4 19.4 19.4 19.5

0.10 8.5 9.0 9.1 9.2 9.2 9.3 9.4 9.4 9.4 9.40.20 3.5 4.0 4.1 4.2 4.2 4.3 4.3 4.4 4.4 4.4

0.01 34.1 30.8 29.4 28.7 28.2 27.9 27.6 27.0 26.6 26.13 0.05 10.1 9.5 9.2 9.1 9.0 8.9 8.8 8.7 8.6 8.5

0.10 5.5 5.4 5.3 5.3 5.3 5.2 5.2 5.2 5.1 5.10.20 2.6 2.8 2.9 2.9 2.9 2.9 2.9 2.9 2.9 2.9

0.01 21.2 18.0 16.6 15.9 15.5 15.2 14.9 14.3 13.9 13.44 0.05 7.7 6.9 6.5 6.3 6.2 6.1 6.0 5.9 5.7 5.6

0.10 4.5 4.3 4.1 4.1 4.0 4.0 4.0 3.9 3.8 3.70.203 2.3 2.4 2.4 2.4 2.4 2.4 2.4 2.4 2.4 2.4

0.01 11.2 13.2 12.0 11.3 10.9 10.6 10.3 9.8 9.4 9.05 0.05 6.6 5.7 5.4 5.1 5.0 4.9 4.8 4.6 4.5 4.3

0.10 4.0 3.7 3.6 3.5 3.4 3.4 3.3 3.2 3.1 3.10.20 2.1 2.2 2.2 2.2 2.2 2.2 2.2 2.1 2.1 2.1

0.01 13.7 10.9 9.7 9.1 8.7 8.4 8.2 7.7 7.3 6.86 0.05 5.9 5.1 4.7 4.5 4.3 4.2 4.1 4.0 3.8 3.6

0.10 3.7 3.4 3.2 3.1 3.1 3.0 3.0 2.9 2.8 2.70.20 2.0 2.1 2.1 2.0 2.0 2.0 2.0 2.0 1.9 1.9

0.01 12.2 9.5 8.4 7.8 7.4 7.1 6.9 6.4 6.0 5.67 0.05 5.5 4.7 4.3 4.1 3.9 3.8 3.7 3.5 3.4 3.2

0.10 3.5 3.2 3.0 2.9 2.8 2.8 2.7 2.6 2.5 2.40.20 2.0 2.0 2.0 1.9 1.9 1.9 1.9 1.9 1.8 1.8

0.01 11.2 8.6 7.5 7.0 6.6 6.3 6.1 5.6 5.2 4.88 0.05 5.3 4.4 4.0 3.8 3.6 3.5 3.4 3.2 2.1 2.9

0.10 3.4 3.1 2.9 2.8 2.7 2.6 2.6 2.5 2.4 2.20.20 1.9 1.9 1.9 1.9 1.9 1.8 1.8 1.8 1.7 1.7

0.01 10.5 8.0 6.9 6.4 6.0 5.8 5.6 5.1 4.7 4.39 0.05 5.1 4.2 3.8 3.6 3.4 3.3 3.1 3.0 2.9 2.7

0.10 3.3 3.0 2.8 2.6 2.6 2.5 2.4 2.3 2.2 2.10.20 1.9 1.9 1.9 1.8 1.8 1.8 1.8 1.7 1.7 1.6

0.01 10.0 7.5 6.5 5.9 5.7 5.3 5.1 4.7 4.3 3.910 0.05 4.9 4.1 3.7 3.4 3.3 3.2 3.1 2.9 2.7 2.5

0.10 3.2 2.9 2.7 2.6 2.5 2.4 2.3 2.2 2.1 2.00.20 1.8 1.9 1.8 1.8 1.8 1.7 1.7 1.7 1.6 1.6

175Banaketa normala eta ondoriozkoak

Page 188: Estatistika teoria eta praktika SPSSWIN erabiliz

A.G. zenbakitzaileen askatasun-graduak

izen p

dat 1 2 3 4 5 6 8 12 24 ∞

0.01 9.65 7.20 6.22 5.67 5.32 5.07 4.74 4.40 4.02 3.60

11 0.05 4.84 3.98 3.59 3.36 3.29 3.09 2.95 2.79 2.61 2.40

0.10 3.23 2.86 2.66 2.54 2.45 2.39 2.30 2.21 2.10 1.97

0.20 1.86 1.87 1.83 1.80 1.77 1.75 1.72 1.68 1.63 1.57

0.01 9.33 6.93 5.95 5.41 5.06 4.82 4.50 4.16 3.78 3.36

12 0.05 4.75 3.88 3.49 3.26 3.11 3.00 2.85 2.69 2.50 2.30

0.10 3.18 2.81 2.61 2.48 2.39 2.33 2.24 2.15 2.04 1.90

0.20 1.84 1.85 1.80 1.77 1.74 1.72 1.69 1.65 1.60 1.54

0.01 9.07 6.70 5.74 5.20 4.86 4.62 4.30 3.96 3.59 3.16

13 0.05 4.67 3.80 3.41 3.18 3.02 2.92 2.77 2.60 2.42 2.21

0.10 3.14 2.76 2.56 2.43 3.35 2.28 2.20 2.10 1.98 1.85

0.20 1.82 1.88 1.78 1.75 1.72 1.69 1.66 1.62 1.57 1.51

0.01 8.86 6.51 5.56 5.08 4.69 4.46 4.14 3.80 3.43 3.00

14 0.05 4.60 3.74 3.34 3.11 2.96 2.85 2.70 2.53 2.35 3.13

0.10 3.10 2.73 2.52 2.39 2.31 2.24 2.15 2.05 1.94 1.80

0.20 1.81 1.81 1.76 1.78 1.70 1.67 1.64 1.60 1.55 1.48

0.01 8.68 6.36 5.42 4.89 4.56 4.32 4.00 3.67 3.29 2.87

15 0.05 4.54 3.68 3.29 3.06 2.90 2.79 2.64 2.48 2.29 2.07

0.10 3.07 2.70 2.49 2.36 2.27 2.21 2.12 2.02 1.90 1.76

0.20 1.80 1.79 1.75 1.71 1.68 1.66 1.62 1.58 1.53 1.46

0.01 8.53 6.23 6.29 4.77 4.44 4.20 3.89 3.55 3.18 2.75

16 0.05 4.49 3.63 3.24 3.01 2.85 2.74 2.59 2.42 2.24 2.01

0.10 3.05 2.67 2.46 2.33 2.24 2.18 2.09 1.99 1.87 1.72

0.20 1.79 1.78 1.74 1.70 1.67 1.64 1.61 1.56 1.51 1.43

0.01 8.40 6.11 5.18 4.67 4.34 4.10 3.79 3.45 3.08 2.65

17 0.05 4.45 3.59 3.20 2.96 2.81 2.70 2.55 2.38 2.19 1.96

0.10 3.03 2.64 2.44 2.39 2.22 2.15 2.06 1.96 1.84 1.69

0.20 1.78 1.77 1.72 1.68 1.65 1.63 1.59 1.55 1.49 1.42

0.01 8.28 6.01 5.09 4.58 4.25 4.01 3.71 3.37 3.00 2.57

18 0.05 4.41 3.55 3.16 2.93 2.77 2.66 2.51 2.34 2.15 1.92

0.10 3.01 3.62 3.42 2.29 2.20 2.13 2.04 1.93 1.81 1.66

0.20 1.77 1.76 1.71 1.67 1.64 1.62 1.58 1.53 1.48 1.40

0.01 8.18 5.93 5.01 4.50 4.17 3.94 3.63 3.30 2.92 2.49

19 0.05 4.38 3.52 3.13 2.90 2.74 2.63 2.48 2.31 2.11 1.88

0.10 2.99 2.61 2.40 2.27 2.18 2.11 2.02 1.91 1.79 1.63

0.20 1.76 1.70 1.66 1.63 1.61 1.57 1.52 1.46 1.39 1.31

0.01 8.10 5.85 4.94 4.43 4.10 3.87 3.56 3.23 2.86 2.42

20 0.05 4.35 3.49 3.10 2.87 2.71 2.60 2.45 2.28 2.08 1.84

0.10 2.97 2.38 2.25 2.16 2.09 2.00 1.89 1.77 1.61 1.54

0.20 1.76 1.75 1.70 1.65 1.62 1.60 1.56 1.51 1.45 1.37

176

Page 189: Estatistika teoria eta praktika SPSSWIN erabiliz

A.G. zenbakitzaileen askatasun-graduak

izen p

dat 1 2 3 4 5 6 8 12 24 ∞

0.01 8.02 5.78 4.87 4.37 4.04 3.81 3.51 3.17 2.80 2.36

21 0.05 4.32 3.47 3.07 2.84 2.68 2.57 2.42 2.25 2.05 1.81

0.10 2.96 2.57 2.36 2.23 2.14 2.08 1.98 1.88 1.75 1.59

0.20 1.75 1.74 1.69 1.65 1.61 1.59 1.55 1.50 1.44 1.36

0.01 7.88 5.66 4.76 4.26 3.94 3.71 3.41 3.07 2.70 2.26

23 0.05 4.28 3.42 3.03 2.80 2.64 2.53 2.38 2.20 2.00 1.76

0.10 2.94 2.55 2.34 2.21 2.11 2.05 1.95 1.84 1.72 1.55

0.20 1.74 1.73 1.68 1.63 1.60 1.75 1.53 1.49 1.42 1.34

0.01 7.77 5.57 4.68 4.18 3.86 3.63 3.32 2.99 2.62 2.17

25 0.05 4.24 3.38 2.99 2.76 2.60 2.49 2.34 2.16 1.96 1.71

0.10 2.90 2.53 2.32 2.18 2.09 2.02 1.93 1.82 1.69 1.52

0.20 1.73 1.72 1.66 1.62 1.59 1.56 1.52 1.47 1.41 1.32

0.01 7.68 5.49 4.60 4.11 3.78 3.56 3.26 2.93 2.55 2.10

27 0.05 4.21 3.35 2.96 2.73 2.57 2.46 2.30 2.13 1.93 1.67

0.10 2.90 2.51 2.30 2.17 2.07 2.00 1.91 1.80 1.67 1.49

0.20 1.73 1.71 1.66 1.61 1.58 1.55 1.51 1.46 1.40 1.30

0.01 7.60 5.42 4.54 4.04 3.73 3.50 3.20 2.87 2.49 2.03

29 0.05 4.18 3.33 2.93 2.70 2.54 2.43 2.28 2.10 1.90 1.64

0.10 2.89 2.50 2.28 2.15 2.06 1.99 1.89 1.78 1.65 1.47

0.20 1.72 1.70 1.65 1.60 1.57 1.54 1.50 1.45 1.39 1.29

0.01 7.56 5.39 4.51 4.02 3.70 3.47 3.17 2.84 2.47 2.01

30 0.05 4.17 3.32 2.92 2.69 2.53 2.42 2.27 2.09 1.89 1.62

0.10 2.88 2.49 2.28 2.14 2.05 1.98 1.88 1.77 1.64 1.46

0.20 1.72 1.70 1.64 1.60 1.57 1.54 1.50 1.45 1.38 1.28

0.01 7.31 5.18 4.31 3.83 3.51 3.29 2.99 2.66 2.29 1.80

40 0.05 4.08 3.23 2.84 2.61 2.45 2.34 2.18 2.00 1.79 1.51

0.10 2.84 2.44 2.23 2.09 2.00 1.93 1.83 1.71 1.57 1.38

0.20 1.70 1.68 1.62 1.57 1.54 1.51 1.47 1.41 1.34 1.24

0.01 4.98 4.13 3.65 3.34 3.12 2.82 2.50 2.12 1.97 1.60

60 0.05 4.00 3.15 2.76 2.52 2.37 2.25 2.10 1.92 1.70 1.39

0.10 2.79 2.39 2.18 2.04 1.95 1.87 1.77 1.66 1.51 1.29

0.20 1.68 1.65 1.59 1.55 1.51 1.48 1.44 1.38 1.31 1.18

0.01 6.85 4.79 3.95 3.48 3.17 2.96 2.66 2.34 1.95 1.38

120 0.05 3.92 3.07 2.68 2.45 2.29 2.17 2.02 1.83 1.61 1.25

0.10 2.75 2.35 2.13 1.99 1.90 1.82 1.72 1.60 1.45 1.19

0.20 1.66 1.63 1.57 1.52 1.48 1.54 1.41 1.35 1.37 1.12

∞ 0.01 6.64 4.60 3.78 3.32 3.02 2.80 2.51 2.18 1.79 1.00

0.05 3.84 2.99 2.60 2.37 2.21 2.09 1.94 1.75 1.52 1.00

0.10 2.71 2.30 2.08 1.94 1.85 1.77 1.67 1.55 1.38 1.00

0.20 1.64 1.61 1.55 1.50 1.46 1.43 1.38 1.32 1.23 1.00

177Banaketa normala eta ondoriozkoak

Page 190: Estatistika teoria eta praktika SPSSWIN erabiliz

5.3. ARIKETAK

1.- 200 subjektuko lagin batean, adimen-test baten batezbestekoa 16 eta desbideratze tipikoa 4 dira.Banaketaren normaltasuna suposatuz:

a) Kalkula ezazu 9 baino gehiago eta 18 baino gutxiagoko puntuazioak lortu dituztenen kopurua.

b) Zenbatek lortu dute 20 puntu baino gehiago? eta 5 baino gutxiago?

c) Kalkula ezazu bere azpitik subjektuen % 90 uzten duen subjektuaren puntuazio zuzena.

d) Zein puntuazio-tartetan aurkitzen da sailkapenaren erdiko subjektuen % 75?

e) Kalkula ezazu D3a eta sailkapenaren ibilbide semiinterkuartilikoa (koartilarteko ibiltarterdia).

2.- Estatistikako azterketan, 95 ikaslez osatutako talde batek banaketa normalari jarraitzen zaizkionemaitzak lortu zituzten eta gainera, kasuen erdiko % 45, 13 eta 18 puntuazioen tartean kokatzen da.Banaketaren batezbestekoa eta desbideratze tipikoa lortu ondoren, kalkulatu:

a) 75. zentila.

b) Zein zentil dagokio 24 puntuazioari?

c) Bila ezazu 16 punturen puntuazio berdina edo handiagoko ikasleen kopurua.

3.- Normal banatutako puntuaketa-talde batean, bere batezbestekoa 60 eta 8. dezila 79 dela jakinik.Kalkulatu:

a) 26 eta 68 puntuazioen artean dagoen subjektu-kopurua.

b) Puntuazio bat batezbestekotik 26 puntu edo gehiago urruntzeko dagoen probabilitatea.

c) Froga gainditu duten subjektuen kopurua, horretarako, batezbestekoaren 5 unitatearen azpitikdagoen puntuazioa baino gehiago lortu behar bada.

4.- Normal banatutako 150 puntuazioetako talde batean 9. dezilak 26 puntu eta 10. zentilak 8 puntubalio dituela jakinik,

a) Zenbat ikaslek lortuko dute 7 puntu baino gehiagoko puntuazioa?

b) Zer portzentaiak lortuko du 28 puntu baino gutxiago?

5.- Errendimenduko test batean OHO-ko 7. mailako batezbestekoa 25 da eta desbideratze tipikoa 8. 8.mailako batezbestekoa, berriz, 32 da eta desbideratze tipikoak 10 balio du. Kalkula ezazu, 7. mai-lako ikasleetatik zenbatek gainditzen duten zortzigarren mailako batezbestekoa eta 7. mailakoenbatezbestekoa gainditzen duten zortzigarren mailako ikasleen portzentaia.

6.- EHU/UPV-n (40.000 ikasle) ikasleen motibazioa neurtu da eta hau banaketa normalarekin bat dator;honako emaitzak lortu dira:

1.–20.000 pertsona 25 puntuazioaren azpitik.

2.–30.000 pertsona 20 eta 30 punturen artean.

Kalkulatu:

a) Zein da EHU-ko ikasleen motibazioaren batezbestekoa? Eta taldearen aldakortasuna?

b) Kalkula itzazu D2, Q3 eta P80.

c) Zer esango zenuke 15 puntuko motibazioa lortu duen pertsonari buruz?

d) Zenbat subjektu egongo da 25 eta 35 balioen artean?

e) Errektoreordeak ikasle motibatuenen % 5 hautatu nahiko balu, zein puntuaziotatik aurrera hau-tatu beharko luke?

178

Page 191: Estatistika teoria eta praktika SPSSWIN erabiliz

7.- 400 ikasleko lagin batean Patxiri, adimen-test batean 30 puntu lortu dituenari, Z=1.96 puntuaziotipikoa dagokiola badakigu. Guztien batezbestekoa 26 puntukoa dela ere badakigu. Kalkula ezazulaginaren emaitzen aldakortasuna. Zein da maiztasun handiena lortu duen emaitza? Zenbatek lor-tzen dute 27 puntu baino gehiago? Zein da zoriz hautatutako subjektu batek -5 eta +3 arteko pun-tuazio diferentzialeko puntuazioa izatearen probabilitatea? Eta 2 eta 1 arteko puntuazio tipikoa iza-tearena?

8.- Selektibitatean aurkeztutako % 95ek azterketa gainditzen du. Azterketa gainditu edo ez gainditzeazorizkoa dela suposatzen badugu, kalkula itzazu ondorengo probabilitateak:

a) Zein da 8 ikasleko lagin batean 7k gainditzeko probabilitatea? Eta gutxienez 7k gainditzekoare-na? Eta gehienez 6k gainditzekoarena? Eta gutxienez 6k gainditzekoarena?

b) Eta 18 elementuz osatutako lagin batean 16k gainditzekoarena? Eta gutxienez 15ek gainditzeko-arena? Eta asko jota 14k? Eta gutxienez 15ek?

c) Zein da institutu batean aurkeztu diren 100 ikasletatik gutxienez 90ek gainditzeko probabilita-tea? Eta zehazki 96ek gainditzekoarena?

9.- Ikastola bateko ikasle guztien (500) irakurketa-ulermena aztertu da. Horretarako, test bat aplikatu etabatezbestekoa 60 eta desbideratze tipikoa 12 izan dira. Lortutako puntuazioak normal banatzendirela eta Iratxek 50 puntu eta Nereak 75 puntu lortu dituztela suposatuz, kalkulatu:

a) Bakoitzari dagokion puntuazio tipikoa.

b) Zenbat ikaslek lortu du Iratxek baino puntuazio okerragoa?

c) Zenbat ikaslek lortu du Nereak baino puntuazio hobea?

d) Zenbatek lortzen dituzte Iratxek baino puntuazio hobeak eta Nereak baino okerragoak?

10.- UBI-ko 1.000 ikasleko talde batek, Selektibitateko puntuazioetan 7.28ko batezbestekoa 0.73ko des-bideratze tipikoa lortu zuen.

a) Selektibitatea gainditu duten ikasleen portzentaia kalkula ezazu.

b) Hautatutako karrera ikasteko 6.83ko nota gainditu behar bada, hau lortu zuten ikasleen portzen-taia kalkula ezazu.

c) Erizaintza ikasteko 8.14ko nota behar da. Zenbatek ikas dezakete erizaintza?

d) 5.83ra iristen ez badira, ezin dute hautatutako 5 lehenengoetako ezer ikasi. Zenbati gertatuzitzaien hori?

e) Zer puntuazio lortu zuten 50 hoberenak?

11.- LHko ikasleen artean gaitasun mekanikoa, kurba normalaren arabera N(60,10) banatzen dela supo-satzen dugu.

a) 3. koartila, 7. dezila eta 35. pertzentila kalkula itzatzu.

b) Zein da banaketa horren bariantza?

c) Zein puntuazio diferentzial eta tipiko dagokio frogan 54 puntu lortu dituen ikasle bati? Zein ene-atipo dagokio subjektu horri?

12.- Kalkula ezazu 200 pertsonek osatutako talde baten desbideratze tipikoa, bere banaketa normaladela jakin ondoren. Badakigu 150 pertsonak 30 puntu baino gehiago lortu dutela ere, eta taldehonen puntuazioen batezbestekoa 50 dela.

Emaitza: 30

179Banaketa normala eta ondoriozkoak

Page 192: Estatistika teoria eta praktika SPSSWIN erabiliz

13.- Demagun Estatistika asignaturan 1.200 ikasle matrikulaturik daudela. Ikasle hauei test estandar batproposatu zaie. Test honen batezbestekoa 50 eta desbideratze estandarra 10 dira. Puntuazioen ara-bera bost talde egitea erabaki da. A taldean, puntuazio txikienak dituztenak, % 5 ikasle daude; B tal-dean % 20; D taldean % 50; E taldean % 20 eta F taldean % 5, azken hau puntuazio altuenak dituz-ten ikasleen taldea izanik. Kalkula ezazu zeintzuk diren talde bakoitzak lortutako puntuazioak.

Emaitzak: 33.6, 43.3, 56.7, 66.5

14.- 80 ikasleri proba bat egin zaie. Lortutako puntuazioak banaketa normalari jarraitzen zaizkio eta 48ikasle izan dira 10.7 puntu baino gutxiago lortu dutenak. Desbideratze tipikoa 2 dela jakinik, kal-kula ezazu:

a) Probaren batezbestekoa.

b) Zenbat ikasle izan diren 9 eta 13 arteko puntuazioak lortu dituztenak.

Emaitazk: 10.2, 0.6449

15.- 300 pertsoneko talde bat aztertzen ari gara. Talde honen banaketa normala da. % 70ek 60 puntubaino gehiago lortu dute eta desbideratze tipikoa 5 bada, kalkula ezazu talde honen batezbestekoa.

Emaitza: 62.65

16.- Ikasle-talde batek X proba bat bete du. Beren puntuazioak banaketa normala jarraitzen zaizkio etalortutako batesbeztekoa 10 eta bariantza 25 dira. 485 pertsonak puntu bat baino gehiago lortu dute-la ere badakigu. Zenbat ikasle izan dira proba hau egin dutenak?

Emaitza: 503

17.- X aldagaian, talde batek lortutako puntuazioak, banaketa normalari jarraitzen zaizkio. 61. pertzen-tila 44 da (P61=44) eta desbideratze tipikoa 2. Ikasle hauei Y izeneko testa pasatu zaie. X eta Y renarteko erlazioa hau da:

10 Xi – 2 Yi + 4 = 0.

Kalkula ezazu:

a) -X

b) -Yc) S2y

Emaitzak: 43.44, 219.2, 100

18.- Pedagogo batek 700 pertsonek osatutako lagin bat aukeratu du bere ikerketarako. Baina ikerketarenbigarren pausorako hauetatik 70 bakarrik behar ditu; honetarako, test psikometriko bat pasatu ondo-ren, puntuazio handienak dauzkatenak aukeratzea erabaki du. Test honek neurtzen duen aldagaiakbanaketa normalari jarraitzen dio eta 20. pertzentila 75.8 da. 140 pertsonak 84.2 puntu baino gehia-go lortu dituztela ere badakigu. Hau jakinda, kalkulatu zein izan den aukeratutakoetatik puntuaziotxikiena lortu dutenen puntuazioa.

Emaitza: 86.4

19.- Adimen-kozienteen puntuazioak banaketa normalari jarraitzen zaizkiotela gauza jakina da. Adi-mena neurtzen duen WISC testa pasatu diegu 500 pertsonari eta hemendik datu hauek lortu ditugu:

1.- batezbesteko aritmetikoa 110 da.

2.- lortutako puntuazioen berredurekin Y aldagaia eratzen badugu, Y aldagai berrien batezbestekoaritmetikoak 12.500 balio du.

Kalkula ezazu zenbat pertsona izan diren beren puntuazioak 56 eta 81 artean dauzkatenak.

Emaitza: 35.05

180

Page 193: Estatistika teoria eta praktika SPSSWIN erabiliz

20.- Txantxangorri batzuk hartu ditugu eta txori hauetan pizgarri batek daukan eragina neurtu nahi dugu.Pizgarrien eragina positibo bezala hartzeko, erantzunak 45 puntutan ezarri dugun muga gainditubehar du. Momentu batean 300 txoriri pizgarria eman ondoren hauen erantzunak neurtu ditugu etalortutako puntuazioak banaketa normala jarraitzen dutela ikusi dugu, batezbestekoa 48 eta barian-tza 81 direla. Zenbat txantxangorrik eduki dute eragin positiboa?

Emaitza: 188.79

21.- Estatistikako azterketa batean bi ikaslek 0.8 eta -0.4 puntuazio tipifikatuak lortu dituzte. Hauen pun-tuazio zuzenak 88 eta 64 izan badira, zeintzuk izan dira azterketako noten batezbesteko eta desbi-deratze tipikoa?

Beste bi ikasleren notak 72 eta 52 izan badira, zeintzuk dira puntuazio hauei dagozkien puntuaziotipifikatuak. Kalkulatu koartilarteko ibiltarterdia.

Emaitza: 72, 20, 0, -1, 13.4

22.- Banaketa normal bati buruz ondoko datu hauek ezagutzen ditugu, koartilarteko ibiltarterdia 1.34 da,P15 = 30 da, eta lagina 3.000 pertsonakoa da. Kalkulatu zenbat izan diren 32 puntu baino gehiagolortu dituztenak.

Emaitza: 1548

23.- Errekan sartzen diren pertsonetatik, badakigu % 98 30 minutu baino gutxiago egoten dela errekabarruan. Desbideratze tipikoa 3 minutukoa da. Errekan pasatako denbora banaketa normalari jarrai-tzen bazaio kalkulatu zenbat pertsona gelditzen diren uretan 20 minutu pasa eta gero. Kalkulatubanaketen batezbestekoa, moda, mediana eta koartilarteko ibiltarterdia.

Emaitzak: 89.97%, 23.85, 2.01

24.- Arrazonamendua neurtzen duen test bat pasatu diegu 500 gizon eta 400 emakumeri eta lortutakopuntuazioa banaketa normalari jarraitzen zaio. Emakumeen puntuazioen moda 50 da eta gizonez-koen 50. pertzentila 46 da, azken hauen desbideratze estandarra 2 izanik. Kalkulatu zenbat gizo-nezko izan diren emakumeen batezbestekoa gainditu dutenak.

Emaitza: 11.4

25.- 500 pertsonaren pisua banaketa normalari jarraitzen zaio; bere parametroak 50 eta 8 dira. Kalkulatuondoko baldintzak betetzen dituzten puntuazioak.

a) bere azpitik % 11 pertsona uzten duena.

b) bere azpitik 220 pertsona uzten duena.

c) bere gainetik % 48 pertsona duena.

d) bere gainetik 320 pertsona duena.

e) zeintzuk dira batezbestekotik simetrikoak diren puntuazioak eta beraien artean % 54 pertsonauzten dutenak?

Emaitzak: 40.16, 48.8, 50.4, 47.12, (44.08, 55.92)

26.- Aldagai bat banaketa normalari jarraitzen bazaio eta bere desbideratze tipikoa 10 bada eta % 40pertsonak 28 puntu baino gutxiago lortzen badute, kalkulatu banaketaren batezbestekoa.

Emaitza: 30.5

27.- Aldagai bat banaketa normalari jarraitzen bazaio eta bere batezbestekoa 32 bada, 150 pertsonak 28puntu baino gutxiago lortzen badute, eta guztira 500 ikasle baldin badira kalkulatu banaketaren des-bideratze tipikoa.

Emaitza: 7.54

181Banaketa normala eta ondoriozkoak

Page 194: Estatistika teoria eta praktika SPSSWIN erabiliz

28.- Aldagai bat banaketa normalari jarraitzen zaio eta gure laginean 500 pertsona dauzkagu. Hauetatik,100 pertsonek 64.20 puntuazioa baino handiagoa lortu badute, eta 130 pertsonek 56.80 puntuazioabaino txikiagoa lortu badute, kalkulatu banaketaren batezbestekoa eta desbideratze tipikoa.

Emaitzak: 60, 5

29.- Banaketa normal batean 500 pertsonetatik 114k 20 puntu baino gutxiago lortzen badute eta bana-ketaren bariantza 16 bada, kalkulatu banaketaren batezbestekoa eta zenbat pertsona izan direnberen puntuazioak 24 eta 28 punturen artean dutenak.

Emaitza: 23

30.- Banaketa normal batean 50.000 pertsona dauzkagu; badakigu aldakuntza-koefizientea 10 dela etakoartilarteko ibiltarterdia 2.01. Kalkulatu zenbat pertsona izan diren 27.9 puntu baino gutxiago lortudutenak.

Emaitza: 12.100

31.- Pedagogo batek 100 itemekin osatutako test bat pasatzen du gela batean. Test honen galdera bakoi-tzak lau erantzun ezberdin ditu eta hauetatik bat bakarrik zuzena. Kalkulatu ondoko gertaeren pro-babilitateak:

a) 15 item baino gutxiago asmatzekoa.b) 24 item asmatzekoa.c) 12 item baino gehiago eta banaketaren batezbestekoa baino gutxiago asmatzekoa.d) 27 baino gehiago asmatzekoa.

Emaitzak: 0.0078, 0.0892, 0.4984, 0.2844

32.- Bi ikastetxetako ikasleak kontuan hartzen ditugu kasu honetan, eta X aldagaiko emaitzak aztertze-rakoen konturatu gara A ikastetxeko Xen emaitzak N(100,15) banaketari jarraitzen zaizkiola, B-koakostera N(110,10) banaketari jarraitzen zaizkio. Ikastetxe bakoitzetik zoriz ikasle bat aukeratzenbadugu, kalkulatu 90 baino handiagoa izateko duen probabilitatea. Eta biak 125 baino handiagoakizatekoa? Eta gutxienez bat izatekoa?

33.- Populazio bateko gizonen pisuak N(72,8) banaketa jarraitzen du, emakumeenak ostera, N(60,σ)jarraitzen du. Emakumeen % 10ak gizonen batezbestekoa baino pisu handiagoa baldin badu, kal-kula ezazu emakumeen desbideratze tipikoa eta ondorengo probabilitateak:

a) Aukeratzen dugun lehenengo gizonak 75 kg baino gehiago izatekoa.

b) Emakume batek gizonen P25 baino gehiago izatekoa.

c) Gizonen pisua emakumeen batezbestekoa baino txikiagoa izatekoa.

d) Gizonen pisua emakumeen batezbestekotik hauen desbideratze tipiko bat baino gehiago alden-tzekoa.

e) Zer da errazagoa, gizon batek 64 kg baino gutxiago edukitzea ala emakume batek 55 kg bainogutxiago edukitzea?

34.- Gai bateko nota banaketa normalari jarraitzen zaiola gauza jakina da. Badakigu kasu honetan % 37k4 puntu baino gutxiago lortu dutela. % 7k 8 puntu baino gehiago lortu dutela ere badakigu. Kalkulaitzazu ondoko probabilitateak.

a) Batezbestekoaren inguruan dauden ikasleen % 60k zein puntuazio lortu duen.

b) Zein puntuaziotatik aurrera egongo dira notarik onenak ateratzen duten % 15? Eta % 35 okerre-nak?

35.- Lehenengo kurtsoan matrikulatuta dauden ikasleetatik % 20k kurtso-bukaera baino lehenago asper-tu eta kurtsoa bertan behera uzten dute. Aurten 120 ikasle matrikulatu baldin badira, kalkula ezazukurtso-bukaerara 90 baino gehiago iristeko dagoen probabilitatea. Kalkula ezazu koartilarteko ibil-tarterdia.

182

Page 195: Estatistika teoria eta praktika SPSSWIN erabiliz

6. INFERENTZIA. OINARRIZKO KONTZEPTUAK

6.1. SARRERA

6.1.1. Zergatik banaketa normala?

6.1.2. Limitearen teorema zentrala

6.2. EMAITZEN OROKORPENA. KONFIANTZA-TARTEAK

6.3. HIPOTESI-TESTA: I. ETA II. MOTAKO ERROREAK

6.4. BI EDO TALDE GEHIAGOTAN LORTURIKO EMAITZEN KONPARAZIOA

6.5. SUBJEKTU BATEK LORTURIKO BALIOEKIKO AURRESANA

6.6. LAGINAREN TEORIA

6.6.1. Laginketa aleatorioak

6.6.2. Laginketa ez aleatorioak

6.6.3. Laginaren tamaina

Page 196: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 197: Estatistika teoria eta praktika SPSSWIN erabiliz

185

6. INFERENTZIA. OINARRIZKO KONTZEPTUAK

6.1. SARRERA

Estatistikan ‘populazio’ hitzak oso esanahi zehatza du: aztertzera goazen, edo ezaugarri jakinen bat azter-tu nahi diegun elementu, pertsona edo gauzen kopuru osoa da. Horrela EAEko hauteskunde aurreko zun-daketa bat egin nahiko bagenu, populazioa EAEko 18 urte baino gehiago eta bozkatzeko eskubidea dutenbiztanleek osatuko lukete. EHU-ko ikasleen poztasun-maila aztertu nahi badugu, EHU-ko ikasketa des-berdin guztietan matrikulatutako jendea da aztergai den populazioa osatuko dutenak.

Populazioaren tamaina edozein izan daiteke. Zenbaitetan tamaina hau txikia izan ohi da eta ezauga-rri zehatz bat aztertzeko, populazioaren elementu guztietara heltzea posible da. Adibidez gelako ikasle-en iritzia jakin nahi badugu galdera zehatz bati buruz, ikasle hauei inkesta bat pasatzea eta ondoren eran-tzunak aztertzea aski litzateke.

Baina besteetan, aztertu nahi dugun populazio osora iristea ezinezkoa egiten zaigu. Adibidez oso zailaizango da bozkatzeko eskubide duten EAE-ko biztanle guztiei hauteskunde aurretik inkesta bat pasatzea.Besteetan, populazioaren elementuak bilatzeak baino, arazo larriagoa sortzen dute aurrera eramatekokostuek, nola dirutan hala dendoran. Kasu hauetan laginketara joko dugu.

Pentsa dezagun aditu batek Fakultateko ikasle guztien altueraren batezbestekoa ezagutu nahi duela(ideia eta helburu arraroagoak ikusi izan dira...). Gure adituak Fakultateko ikasle guztiak topatzea nahikozaila dauka (berak badaki zenbait, matrikula egunean bakarrik azaltzen direla..., eta agian azterketara),eta horrela izanik, Fakultateko ikasleen lagin batekin lan egitea erabakitzen du. Horretarako, Estatistika--libururen bat irakurri ondoren, neurgailua tabernaren sarreran jarri eta 100 ikasleri altuera neurtzea era-bakitzen du. Pazientzia handiz, eta ikasle askok barre egin arren, berak bere azterketa egiten du, eta han-dik pasatako lehenengo 100 pertsonei altuera neurtu zien. Bere kalkuluak egin eta gero, 171 cm-ko batez-bestekoa lortu zuen. Bera oso pozik geratzen da. Baina galdera garrantzitsua orain sortzen da:

Zenbateraino da fidagarria emaitza hau? Lortutako emaitza zenbateraino hurbilduko da Fakultatekoikasleen batez besteko altueraren egiazko baliora?

Gure adituari, galdera hauek erantzuteko gai ez den bitartean, erabili duen prozedurak ez dio ezerta-rako balio. Beste edozein adituk antzeko prozedura bat burutu eta baiezta dezake ikasleen batez bestekoaltuera 168 cm dela. Bietako zeinek izango luke arrazoi?

Gai honetan galdera hauei erantzuten saiatuko gara, zeharka bada ere, hau da bakoitzak jarraitu duenprozesuaren onargarritasuna aztertuz.

Aditu bakoitza fakultateko ikasleen altuerari dagokionez, errorera lotua dago, populazioaren zatibaten altuera bakarrik neurtu baitute. Populazioaren lagin bat neurtu dute, orduan, lehenengoak popula-zioaren egiazko altuera honako hau dela esango du:

168 ± errore txikia

Bigarrengoak bere kalkuluen arabera egiazko altuera honakoa dela esango du:

171 ± errore txikia

Gure lana errore txiki hau koantifikatzea izango da.

Hori bai, aurrerantzean neurtu nahi dugun aldagaia ongi neurtzen ari garela suposatuko dugu, hau daaltuera neurtzeko darabilgun neurgailua ona dela, eta neurketak errorerik gabe burutzen ditugula.

Aipatutakoak, Inferentzia estatistikoak azter daitezkeen arazoetako batzuk dira. Baina eskaintzendituen aukerak askoz ere zabalagoak dira.

Page 198: Estatistika teoria eta praktika SPSSWIN erabiliz

Atal honetan aukera hauen aurkezpen orokor bat egiten saiatuko naiz eta hemendik aurrera aztertukoditugun gaiak, inferentzia estatistikoa deitutakoari dagozkionak izango dira.

Inferentzia hitzaz zera uler dezakegu: “zerbaitetik ondorio bat atera”. Guk gure aldetik inferentziaestatistikoen definizio bat ematerakoan hau esan dezakegu: “Estatistikari dagokion atal bat da, zeinakpopulazioaren lagin adierazgarri baten datuez baliaturik populazio guztirako ondorioak edota zenbaiterabaki hartzeko arauak ematen dituen”.

Datu batzuen analisiari ekin baino lehen, kontuan hartu behar duguna hau da: aztertu behar ditugundatuak ea populazio osoarenak diren edo, lagin bati dagozkionak diren. Eta, azken kasu honetan, lortu-tako emaitzak ea populazioaren ezaugarritzat joko ditugun ala ez, hots, orokortu nahi ditugun ala ez.

Demagun edozein hiritako biztanleen pisuen batezbestekoa aztertu nahi dugula. Horretarako, mo-mentu jakin batean biztanle guztiak neurtzea, metodo bat izan liteke. Jakina denez, horrela lorturikopisuen analisiak populazio osoari dagozkionak dira eta, ondorioz, kalkulaturiko batezbestekoa etabiztanleen batezbesteko erreala bat etorriko dira. Hala ere biztanlego osoa une jakin batean neurtzeakduen zailtasuna ez luke inork ukatuko.

Horregatik, aurreko populazioko zati bat erabili ohi da, eta, azpipopulazio honetatik lorturiko emai-tzetan oinarrituz populazio osoaren emaitzak “inferitu” egiten dira. Arestian esan dugunez, azpipopula-zio hori “lagina” izendatzen dugu. Lagin honetako elementuen hautaketak garrantzi handia edukiko du,zeren eta aukeratutako elementuak izango dira gure neurgailuen bidez neurtuko ditugunak. Lagina zeinizango den erabakitzerakoan, hots, populazioarekiko lagin adierazgarria izatea oinarrizko helburutzatjotzen dugunean, (beste era batera esanda, populazioari dagozkion emaitzak eta gure laginarenak bat etordaitezen), gai honen bigarren zatian aztertuko ditugun funtsezko bi irizpideri jarraitu behar gatzaizkie.Honako hauei hain zuzen:

– Neurtu behar dugun subjektu-kopuru minimoa

– Subjektuen hautaketa

Edonola ere gai honen lehen zatian, laginaren hautaketa zuzena dela joko dugu, eta bigarren zatian,laginaren kopurua nola erabaki, eta hautaketa zuzena nola egin, aztertuko ditugu.

Beraz, darabiltzagun datuak, aztertzen den populazioarekiko adierazgarriak direla suposatuko dugu.

Datu-bilketa egin ondoren, atera nahi ditugun ondorioak honako hiru alderdi hauetan sailka ditzake-gu:

1.- Laginean lorturiko emaitzak populazio osoari orokortzea.

2.- Bi taldetan edo gehiagotan lorturiko emaitzen arteko konparazioa egitea.

3.- Subjektu jakin bati buruz lorturiko emaitzen arabera erabakiak hartzea.

Galdera horiei erantzun ahal izateko, estatistikak, ondorengo kapituluetan aztertuko ditugun teknikaezberdinak eskaintzen dizkigu. Baina teknika guztien atzetik banaketa teorikoak daude. Batzuk aurrekogaietan ikusi izan ditugu. Gehienak kurba normaletik datoz. BAINA ZERGATIK DA HAIN GARRANTZI-TSUA KURBA NORMALA? Hemendik aurrera, banaketa honen garrantzia eta Estatistikan oinarrizkoa denteorema baten garrantzia adierazten saiatuko natzaizu: Limitearen teorema zentrala.

6.1.1. Zergatik banaketa normala?

Sarritan topatzen dugun arazoa honakoa da: ez dakigu aldagai baten batezbestekoa, ez desbideratze tipi-koa, ez populazioaren banaketa nolakoa den, ez.. Eta hau guztia da guk jakin nahi duguna.

Imajina dezagun Gipuzkoako herri bateko, Oñatikoa adibidez, biztanleen adinaren batezbestekoajakin nahi dugula. Zergatik?... Eta zergatik ez? Ni oñatiarra naiz! Beno, zoriz 4 pertsona hautatzen dituteta adin hauek dituzte: 26, 73, 14 eta 39: Batezbestekoa: X = 38 urte.

186

Page 199: Estatistika teoria eta praktika SPSSWIN erabiliz

Printzipioz ez dut benetako baliora asko edo gutxi urreratzen den adierazten didan irizpide edo ara-zonamendurik. Kasualitate handia litzateke, pertsona hauen batezbestekoa Oñatiko populazioaren batez-bestekoarekin bat etortzea.

Beste froga bat egingo dugu. Beste lau pertsona hartuko ditugu. Hauen adinak: 47, 64, 17, 56.Batezbestekoa: X = 46 urte.

Egia esan, diferentzia dexente dago! Zeinekin geratuko naiz? Ez bata ez bestearekin! Irizpiderik gabejarraitzen dut.

Ez da ez hau ikasgelan egiteko ariketa txarra. Pentsa dezagun gelako 100 ikasleetako bakoitzakOñatira joan eta zoriz 4 pertsona hautatu dituela (inoiz ez topatzen dituen lehenengo laurak, ezta lehe-nengo lau haurrak, ezta lehenengo lau aitonak, ez du asmatzea balio...) eta pertsona hauen adinarenbatezbestekoak kalkulatzen dutela. 100 pertsonen batezbestekoak arbelean idazten baditugu, gutxi gora-behera, hurrengo taulako “lagina = 4” zutabean agertzen direnak izango dira. Taulan hamarrenak ez ditutadierazi, eta batezbestekoak biko bloketan taldekatu ditut, luzeegia izan ez zedin.

Oraindik ere ez dut ezer argitzen, ordea. Batezbestekoak 17tik 65 arte aldatzen dira. Estatistikarik gabeere!... norbaitek esan zezakeen eta egia da... Baina jo dezagun aurrera ea zer topatzen dugun.

Ondoren, ikasle ezberdinek lortu dituzten emaitza desberdinak ikusiz, berriro ere Oñatira bidaltzeaerabaki dut. Horrela bertan dugun Unibertsitate zoragarria ezagutuko dute, eta bide batez zoriz, 9 per-tsona hautatu eta adinaren batezbestekoa kalkula dezatela. Emaitzak hurrengo blokean daude “lagina =9”. Zertxobait gehiago zehazten noala ikus daiteke. Oraingo honetan, batezbestekorik baxuena 25 urte-takoa da, altuena 57koa den bitartean.

Oraindik ez dakit nori sinetsi. Ikasleen laginetan batezbestekoen aldakortasuna handiegia da.

lagina = 4 lagina = 9 lagina = 25 lagina = 100

Adina ni Adina ni Adina ni Adina ni

17 1 17 17 1719 1 19 19 1921 2 21 21 2123 0 23 1 23 2325 3 25 1 25 2527 3 27 2 27 2729 6 29 2 29 2931 8 31 3 31 1 3133 5 33 4 33 2 3335 6 35 5 35 4 3537 7 37 13 37 10 37 939 11 39 9 39 19 39 2241 13 41 14 41 28 41 4843 10 43 16 43 17 43 1545 5 45 10 45 9 45 547 5 47 7 47 6 47 149 3 49 6 49 3 4951 4 51 3 51 1 5153 1 53 1 53 5355 0 55 1 55 5557 2 57 2 57 5759 1 59 59 5961 1 61 61 6163 0 63 63 6365 2 65 65 65

Berriro ere Oñatira bidaltzen ditut, herri osoa miretsi eta Urbiatik bueltatxo bat eman dezaten, adinagaldetzen duten bitartean, orain 25 pertsonari. Guztiz zintzo (ez ahaztu asmatutako adibidea dela), datu--bilketa egiten dute, eta emaitzak hirugarren blokekoak dira. Batezbestekoak jada, ez dira hain alda-korrak, ikasle ezberdinen emaitzak gero eta gehiago pilatzen dira 41 balioaren inguruan. Orain jada ikusdezakegu 4 eta 9 subjektuen laginekin ere, 41 urteren inguruan pilatzen zirela.

187Inferentzia. Oinarrizko kontzeptuak

Page 200: Estatistika teoria eta praktika SPSSWIN erabiliz

Histograma egiten baduzu, aurreko gaian aztertu duguna, kurba normalaren antza duela ikusiko duzu.

Baina oraindik gustura ez nagoenez, ikasleak laugarren aldiz bidaltzen ditut Oñatira, eta oraingoan,kaleetan zehar gehiago pasea dezatela eskatzen diet, 100 subjektuko lagin aleatorio bat jaso arte, ezagu-tzea merezi duen herria ikusten duten bitartean. Zer gertatu da batezbestekoarekin? Gero eta gehiago pila-tzen dela 41aren inguruan. Elkarren artean antza handia dute jada. Diferentziak txikiak dira. Hau inte-resgarri bihurtzen ari da. Eta 100 pertsonekin bakarrik! Norbaitek ia oñatiar guztiei bere adina galdetu die-gula esan dezake. Eta egia da! Baina bi azalpen emango dizkizut.

Lehenengoa: azterketa bat egitera noanean, nik 100 pertsona bakarrik hartuko ditut, eta jakitea inte-resatzen zaidana zera da; nik lortuko ditudan emaitzen (laginarenak) batezbestekoak zenbaterainokoantzekotasuna izango duen benetako batezbestekoarekin (populazioarenarekin). Baina benetakoarenbalioa zein den ez dakidanez, nik 100 pertsonen batezbestekoa 40 dela esan dudanean, ez dadila inoratzetik etorri batezbestekoa 17 dela esanaz. n = 100 taulan adierazten den erregulartasunak, hau gerta-tzea ezinezkoa dela esaten dit.

Bigarrengoa: prozedura hau Oñati, Donostia nahiz Tokiorako berdina da. Eta orain 100 pertsonekinbakarrik, Tokioko guztien benetako adinera inguratzea ere posible dela ikusten dugu, jada oso interesga-rria izan daiteke, eta merkea!

Baina jarrai dezagun. Oraindik estatistikak zenbait gauza argituko baitizkit.

Begira itzatzu ongi datuak. Lau ondorio atera genitzake:

1.- Datuak gero eta gehiago pilatzen dira 41aren inguruan.

2.- Kasu guztietan balio zentrala 41 da.

3.- Datuak gutxi gorabehera modu berean sailkatzen dira, 41 urteren gainetik eta 41 urteren azpitik.

4.- Neurriek, sailkapen normala darraitela dirudi (egin itzazu histogramak).

Hau guztia kasualitatez ote da? EZ!

Honek guztiak oinarri bat du. Hau estatistikaren erregulartasunik garrantzitsuenetako bat da. Ikusezazu pertsonen adina ez zaiola sailkapen normalari jarraitzen. Ez da egia adinik maizkoena 41 urtedenik, eta 41 urtetik aldenduz goazen eran gutxitzen doanik, goiko adinentzat bezala behekoentzat.Pilaketa honen erantzuna, LIMITEAREN TEOREMA ZENTRALEAN edukiko dugu.

Baina teorema hau enuntziatu aurretik, bigarren azterketa bat egingo dugu. Hau egiteko ez duguOñatiko kaleetan ibili beharko. Hau da tristuria!

Ondorengo orrialdean aurkezten dizudan zenbaki aleatorioen taularekin egingo dugu. Taula hau osoerabilia da, lagin aleatorioak ateratzeko, adibidez. Taulan 0tik 100 arteko zenbaki guztiak nahasiandaude. Badakit zenbaki guztiak banatuak daudela, beraz datu hauen egiazko batezbestekoa 49.5ekoa da(gogoan izan txikiena 0 eta handiena 99 dela). Eta desbieratze tipikoa 29.01 izango da. Kalkuluak eskuzegin ditzakezu edo, SPSSWIN fitxategi batean 100 datu (0tik 99ra) sartuz, eta kalkuluak egitera murgilduzere.

188

Page 201: Estatistika teoria eta praktika SPSSWIN erabiliz

Zenbaki aleatorioen taula, taldeka sailkatuta, irakurtzeko errazago izateko bakarrik

39 65 76 45 45 19 90 69 64 61 20 26 36 31 62 58 24 97 14 97 95 06 70 99 00

73 71 23 70 90 65 97 60 12 11 31 56 34 19 19 47 83 75 51 33 30 62 38 20 46

72 20 47 33 84 51 67 47 97 19 98 40 07 17 66 23 05 09 51 80 59 78 11 52 49

75 17 25 69 17 17 95 21 78 58 24 33 45 77 48 69 81 84 09 29 93 22 70 45 80

37 48 79 88 74 63 52 06 34 30 01 31 60 10 27 35 07 79 71 53 28 99 52 01 41

02 89 08 16 94 85 53 83 29 95 56 27 09 24 43 21 78 55 09 82 72 61 88 73 61

87 18 15 70 07 37 79 49 12 38 48 13 93 55 96 41 92 45 71 51 09 18 25 58 94

98 83 71 70 15 89 09 39 59 24 00 06 41 41 20 14 36 59 25 47 54 45 17 24 89

10 08 58 07 04 76 62 16 48 68 58 76 17 14 86 59 53 11 52 21 66 04 18 72 87

47 90 56 37 31 71 82 13 50 41 27 55 10 24 92 28 04 67 53 44 95 23 00 84 47

93 05 31 03 07 34 18 04 52 35 74 13 39 35 22 68 95 23 92 35 36 63 70 35 33

21 89 11 47 99 11 20 99 45 18 76 51 94 84 86 13 79 93 37 55 98 16 04 41 67

95 18 94 06 97 27 37 83 28 71 79 57 95 13 91 09 61 87 25 21 56 20 11 32 44

97 08 31 55 73 10 65 81 92 59 77 31 61 95 46 20 44 90 32 64 26 99 76 75 63

69 26 88 86 13 59 71 74 17 32 48 38 75 93 29 73 37 32 04 05 60 82 29 20 25

41 47 10 25 03 87 63 93 95 17 81 83 83 04 49 77 45 85 50 51 79 88 01 97 30

91 94 14 63 62 08 61 74 51 69 92 79 43 89 79 29 18 94 51 23 14 85 11 47 23

80 06 54 18 47 08 52 85 08 40 48 40 35 94 22 72 65 71 08 86 50 03 42 99 36

67 72 77 63 99 89 85 84 46 06 64 71 06 21 66 89 37 20 70 01 61 65 70 22 12

59 40 24 13 75 42 29 72 23 19 06 94 76 10 08 81 30 15 39 14 81 83 17 16 33

63 62 06 34 41 79 53 36 02 95 94 61 09 43 62 20 21 14 68 86 94 95 48 46 45

78 47 23 53 90 79 93 96 38 63 34 85 52 05 09 85 43 01 72 73 14 93 87 81 40

87 68 62 15 43 97 48 72 66 48 53 16 71 13 81 59 97 50 99 52 24 62 20 42 31

47 60 92 10 77 26 97 05 73 51 88 46 38 03 58 72 68 49 29 31 75 70 16 08 24

56 88 87 59 41 06 87 37 78 48 65 88 69 58 39 88 02 84 27 83 85 81 56 39 38

22 17 68 65 84 87 02 22 57 51 68 69 80 95 44 11 29 01 95 80 49 34 35 86 47

19 36 27 59 46 39 77 32 77 09 79 57 92 36 59 89 74 39 82 15 08 58 94 34 74

16 77 23 02 77 28 06 24 25 93 22 45 44 84 11 87 80 61 65 31 09 71 91 74 25

78 43 76 71 61 97 67 63 99 61 80 45 67 93 82 59 73 19 85 23 53 33 65 97 21

03 28 28 26 08 69 30 16 09 05 53 58 47 70 93 66 56 45 65 79 45 56 20 19 47

04 31 17 21 56 33 73 99 19 87 26 72 39 27 67 53 77 57 68 93 60 61 97 22 61

61 06 98 03 91 87 14 77 43 96 43 00 65 98 50 45 60 33 01 07 98 99 46 50 47

23 68 35 26 00 99 53 93 61 28 52 70 05 48 34 56 65 05 61 86 90 92 10 70 80

15 39 25 70 99 93 86 52 77 65 15 33 59 05 28 22 87 26 07 47 86 96 98 29 06

58 71 96 30 24 18 46 23 34 27 85 13 99 24 44 49 18 09 79 49 74 16 32 23 02

93 22 53 64 39 07 10 63 76 35 87 03 04 79 88 08 13 13 85 51 55 34 57 72 69

78 76 58 54 74 92 38 70 96 92 52 06 79 79 45 82 63 18 27 44 69 66 92 19 09

61 81 31 96 82 00 57 25 60 59 46 72 60 18 77 55 66 12 62 11 08 99 55 64 57

42 88 07 10 05 24 98 65 63 21 47 21 61 88 32 27 80 30 21 60 10 92 35 36 12

77 94 30 05 39 28 10 99 00 27 12 73 73 99 12 49 99 57 94 82 96 88 57 17 91

Taula honen lagin aleatorioak aterako ditugu. Hemen gelan 100 ikasle ditugula suposatzen segitzendugu taula honen gardenki bat jarri dut eta ikasle bakoitzari zera eskatzen diot: lehenengo gauza zenba-ki bat apunta dezala, gero 4 eta hauen batezbestekoa kalkula dezala gero; zoriz baita ere, aukera ditzala9 zenbaki, gero 25 zenbaki, 100 zenbaki eta azkenik, 1.600 zenbaki, eta kasu bakoitzean batezbestekoaeta desbideratze tipikoa kalkula ditzala. Azkenean, kasu bakoitzean 100 datu-talde, 100 neurri...izangoditut.

189Inferentzia. Oinarrizko kontzeptuak

Page 202: Estatistika teoria eta praktika SPSSWIN erabiliz

Ondorengo taulan, itxuraz, ikasleek lortutako emaitzak dituzu.

lagina = 1 lagina = 4 lagina = 9 lagina = 25 lagina = 100

X ni X ni X ni X ni X ni

0 – 9 9 0 – 9 0 – 9 0 – 9 0 – 9

10 – 19 12 10 – 19 1 10 – 19 10 – 19 10 – 19

20 – 29 7 20 – 29 8 20 – 29 2 20 – 29 20 – 29

30 – 39 8 30 – 39 12 30 – 39 16 30 – 39 5 30 – 39

40 – 49 15 40 – 49 25 40 – 49 28 40 – 49 41 40 – 49 47

50 – 59 7 50 – 59 23 50 – 59 35 50 – 59 40 50 – 59 53

60 – 69 12 60 – 69 16 60 – 69 14 60 – 69 4 60 – 69

70 – 79 8 70 – 79 11 70 – 79 3 70 – 79 70 – 79

80 – 89 9 80 – 89 4 80 – 89 1 80 – 89 80 – 89

90 – 99 13 90 – 99 90 – 99 90 – 99 90 – 99

Ikus dezagun orain, sakonago, n = 25, n = 100 eta n = 1.600 laginekin lortutako batezbestekoak nola-koak diren.

lagina = 25 lagina = 100 lagina = 1600

X ni X ni X ni

35 – 37 1 40 – 41 2 40 – 41

38 – 40 5 42 – 43 6 42 – 43

41 – 43 8 44 – 45 10 44 – 45

44 – 46 13 46 – 47 12 46 – 47 1

47 – 49 19 48 – 49 17 48 – 49 46

50 – 52 24 50 – 51 21 50 – 51 51

53 – 55 13 52 – 53 13 52 – 53 2

56 – 58 10 54 – 55 11 54 – 55

59 – 61 6 56 – 57 7 56 – 57

62 – 64 1 58 – 59 1 58 – 59

Azter ditzagun, ikasleek lortu dituzten (ustezko) emaitzak. Hemendik aurrera zeren bila gabiltzan garbieduki behar duzu. Guk, kasu honetan, egiazko batezbestekoa 49.5 dela badakigu. Eta neurri ezberdine-tako laginak simulatu nahi ditugu, laginen batezbestekoak, kasu honetan ezagutzen dugun, benetakobaliora nola hurbiltzen diren ikusteko (errealitatean gertatzen ez bada ere, limitearen teorema zentralaadierazi nahian nabil).

1 neurriko laginaren kasuan ikasleek, posible guztien artean, edozein elementu hautatu dute.Hautatutako elementuak aldagaiaren luzera guztian banatzen dira. Emaitzak, beraz, 0 eta 100 bitarteandoaz. Zortez (zoriz) besteetan baino kasu gehiago dauden tarte batzuk badira. Ezer berezirik ez. Kontuanizan behar dugu tarte bakoitzean 10eko maiztasun teoriko bat izan behar litzatekeela, baina batzuetanbesteetan baino elementu gehiago erori dira. Edonola, emaitza hauek zenbaki aleatorioen taulan motaguztietako balioak daudela adierazten didate. Aurrera!

Hurrengo taulan, lagina = 4, 4 neurriko laginak hautatu ditugula suposatzen dugu, eta jada, batez-bestekoen emaitzak muturretatik aldenduko dira. Noski, 4 subjektuko lagin baten batezbestekoa 10 bainotxikiagoa izateko, lau elementuek oso txikiak izan behar dute, bere baturak 40 baino txikiagoa izan behardu. Eta hau oso da arraroa (ezinezkoa ez bada ere). Modu berean 4 balioko batezbestekoa 90 eta 99 arte-an egoteko, lau zenbakiek 90en ingurukoak edo handiagoak izan beharko lukete. Arraroa baita ere. Jadabatezbestekoak erdiko bi tartetan pilatzen hasten dira. Oraindik batezbestekoak nahikoa aldakorrak dira.Baina emaitzen sailkapenaren forma sailkapen normalaren antza hartzen ari da, ondorengo grafikoanikusten dugun bezalaxe:

190

Page 203: Estatistika teoria eta praktika SPSSWIN erabiliz

9 tamainako laginera pasatzen bagara, batezbestekoen pilaketa handituz doa “benetako” balioareninguruan: 49.5. Pixkanaka muturretako balioak desagertzen doaz eta batezbestekoak erdiko tartetan bil-tzen dira.

Aurreko adibidean “n = 25”-ekin bezala, pilaketa handituz doala ikus dezakezu, “N = 100”-entzaterdiko bi tarteetara murriztua geratuz.

Ikus dezagun, ondorengo grafikoetan, laginen batezbestekoekin zer gertatzen den.

N = 9-rentzat. Laginen 100 batezbestekoak, kurba normalarekiko antzeko moduan sailkatzen direlaikus dezakegu. Eta batezbestekoaren benetako balioaren inguruan (49.5). Laginaren 100 batezbestekoenbatezbestekoa 49.7 dela ikus daiteke. Orain sailkapenaren forma bai dela kurba normalaren oso antze-koa. Ikus ezazu desbideratze tipikoak 9.67 balio duela. Oraindik asko da. Ezingo naiz neurri hauetazgehiegi fidatu, 25etik 75era arte aldatzen baitira (50eko luzera). Baina pixkanaka batezbestekoaren ingu-ruan pilatzen doaz.

Prozesu bera baina 25 subjekturekin egite-an, ikus ditzagun batezbestekoak nola sailka-tzen diren. Batezbestekoen batezbestekoaorain, 49.4 da. Kurba normalerako gerturatzeagero eta hobea da. Desbideratze tipikoa5.66raino jeitsi da. Ohar zaitez batezbesteko-ak, jada 37.5 eta 62.5en artean aldatzen direla(25eko luzera). Eta laginaren neurria handitzendugun eran, luzera txikitu egiten dela, beneta-ko batezbestekorako hurbilketa handiagoa iza-nik.

191Inferentzia. Oinarrizko kontzeptuak

Desbid. estandarra = 9.67Batezbestekoa = 49.7N = 100

Desbid. estandarra = 15.55Batezbestekoa = 52.0N = 100

LAGINA = 9

LAGINA = 4

LAGINA = 25

Desbid. estandarra = 5.66Batezbestekoa = 49.4n = 100

Page 204: Estatistika teoria eta praktika SPSSWIN erabiliz

n = 100ekin emaitzak garrantzitsuak izaten hasten dira. Jada batezbestekoak benetako baliora,49.5era, nahikoa hurbiltzen dira. Batezbestekoen batezbestekoa benetako batezbestekoa da zehazki.Batezbestekoen desbideratze tipikoa 2.90 da. Luzera osoa 16 unitatekoa bakarrik da 42tik 58ra.Batezbestekoen banaketa-kurba normala da.

Azkenik, N = 1.600ekin lortutako emaitzak ikusiko ditugu. Hemen jada, asmatzen ari gara. Hartu ditu-gun emaitzak 48.1 eta 50.9ren artean aldatzen dira. Orotara, txikienetik handienera arte 2.4 unitateko dis-tantzia dago. Batezbestekoen batezbestekoa, zehazki benetako batezbestekoa da. Batezbestekoak kurbanormalera oso ongi doitzen dira.

Ez dakit ohartzen zaren, hau edozein populaziotarako baliagarria dela. Nik EAEko ikasleen ikastekoohituren mailaren batezbestekoa jakin nahiko banu, hau izango litzateke lortuko nukeen zehaztasun--maila, nik zerbait ezagutu nahi dudan populazioaren tamainatik aparte.

Baina gure galdera hau zen ZERGATIK KURBA NORMALA? Uste dut erantzuna susmatzeko gai izan-go zarela. Nahiz eta aldagaia (nik aztertu nahi dudan ezaugarria) sarritan banaketa normalari jarraitu ez,zoriz aukeratutako lagin ezberdinetako BATEZBESTEKOA BETI BANAKETA NORMALARI JARRAITUKOZAIO. Hori esaten digu LIMITEAREN TEOREMA ZENTRALAk; hona hemen bere enuntziatua:

LIMITEAREN TEOREMA ZENTRALA: n neurriko lagin aleatorio sinpletan, laginaren batezbestekoa

(X) populazioaren batezbestekoaren μ inguruan aldatzen da, σ /√-n errore estandar batekin, (non σpopulazioaren desbiderazio estandarra den). X aldagaiaren banaketa, gero eta gehiago hurbiltzenda kurba normalera, n lagin neurria handituz doan eran.

Aurreko teoremak kurba normalaren garrantzia azpimarratzen du. Laginaren neurria handitzen doanheinean, banaketa kurba normalera gero eta gehiago hurbiltzen dela dio.

Lagina modu aleatorio sinplean atera behar dela adierazten du. Sailkatzeko modua aurrerago ikusikodugu, baina ezinbestekoa da laginaren sailkapena zoriz egitea.

192

Desbid. estandarra = 2.90Batezbestekoa = 49.5N = 100

Desbid. estandarra = 0.72Batezbestekoa = 49.5N = 100

LAGINA = 100

LAGINA = 1600

Page 205: Estatistika teoria eta praktika SPSSWIN erabiliz

σ /√-n , inferentzian hartzen duen garrantzia dela eta, balio honi ERRORE ESTANDARRA deritzo.

Teorema honek esaten duenaren arabera, ikus dezagun lehen lortutako laginen garapen eta bilakaera.Gogora dezagun gelako 100 ikasleek, banan banan, 9, 25, 100 eta 1.600 pertsonaz osatutako laginak jasodituztela eta beraien emaitzak konparatzen ari garela. Laginen batezbestekoen eta batezbestekoen desbi-deratze tipikoen bilakaera, honakoa izan da:

Batezbestekoen Batezbestekoen

Laginaren tamaina batezbestekoa desbideratze estandarra

Errore estandarra

n = 9 49.7 9.67

n = 25 49.4 5.66

n = 100 49.5 2.90

n = 1600 49.5 0.72

Laginaren tamaina handiagoa den neurrian, batezbestekoen batezbestekoa gehiago hurbildu da bene-tako batezbestekora (49.5). Eta garrantzitsuena dena, zehaztasunaren inguruan, 100 ikasleek lortutakobatezbestekoak oso berdintsuak izan direla da. Hau baita estatistikarekin lanean iharduteari zentzua ema-ten diona: lortutako zehaztasuna.

Nola neurtuko dut zehaztasuna? Desbideratze tipikoarekin, edo desbideratze tipikoa eta laginaren

neurria nahasten dizkidan σ /√-n errore estandarraren balioarekin?

Eta zeren arabera dago zehaztasun hau? Limitearen teorema zentralak eta errore estandarrak bi gauzaesaten dizkidate honi buruz:

1.- Populazioaren desbideratze tipikoa zenbat eta handiagoa izan aldakortasuna handiagoa izango duda-la. Noski! 20 urteko pertsonen altuera kalkulatzen ari banaiz, zehaztasun gutxiago (aldakortasun han-diagoa) izango dut, urte beteko haurrekin jarduten banaiz baino, 20 urteko pertsonen altuera urtebetekoena baino gehiago aldatzen baita.

2.- Laginaren tamaina zenbat eta handiagoa izan, gutxiago aldatuko da. Logikoa da hau ere. Laginarenneurria zenbat eta handiagoa izan zortearen eragina txikiagoa izango da eta lagina adierazgarriagoaizango da. 100 pertsona hartzen baditut beraien adinen batezbestekoa jakiteko, 4 hartuta baino gehia-go asmatuko dut. Baina, zenbat gehiago? Laginaren neurriaren erro karratuaren alderantzizko propor-tzioan haziko da. Hau da, neurri bikoitzeko lagin bat hartzegatik, ez zait erdira jaisten, 2ren erro karra-tuaren proportzioan baizik. Ohar zaitez “n=9”-rentzat, desbideratze tipikoak 9.67 balio zuela, eta“n=1.600”-entzat, 0.73 balio zuela. Edo “n=25”-entzat 5.80 balio zuela eta laginaren neurria bider 4egin eta 100 izatera pasatzean, desbideratze tipikoa erdira jaitsi zaigula: 2.90. Egin zuk zeure kalku-luak.

Hau guztia ikusi ondoren, aztertutakoarekin zerikusia duen bigarren galdera bat sortzen zaigu.

Zenbateraino fida naiteke laginean lortutako emaitzaz?

Oraingoan ere, erantzuna limitearen teorema zentralean daukagu. Aldagai batek izan dezakeen formatikaparte, hartuz joan gaitezkeen laginen batezbestekoen sailkapenak, sailkapen normala, μ batezbestekoaeta σ desbideratze tipikoa segitzen du. Hau LAGINKETA ALEATORIO SINPLE BAT EGITEN DEN GUZ-TIETAN egiaztatzen da.

Honen ondorio bezala, aurreko gaian ikusi ditugun kurba normalaren propietateak erabiliz, adibidez,modu honetako probabilitate bat kalkula dezakegu:

193Inferentzia. Oinarrizko kontzeptuak

Page 206: Estatistika teoria eta praktika SPSSWIN erabiliz

Pentsa dezagun Fakultateko ikasleen pisuaren batezbestekoa zein den jakin nahi dugula. Horretarakobadakigu pisuaren desbideratze tipikoa 9 kilokoa dela. 100 ikasleko lagin aleatorio bat hartzen badut,benetako baliora 2 kilo baino gutxiagoz hurbiltzeko probabilitatea zein den jakin nahi dut.

Horretarako egingo dudana hauxe da: laginaren batezbestekoa, μ batezbestekoaz eta σ desbideratzetipikoaz, banaketa normal bati dagokion moduan banatzen dela badakit. Gure kasuan ia beti bezala,pisuaren benetako balioa ezezaguna da baina ezagutu beharrik ere ez dut. Ikus dezagun nola askatukodugun. Eskatzen didaten probabilitatea kurbaren alderdi ilunekoa da.

Kurbaren alderdi iluna batezbestekoa + 2 eta - 2ren tartean dagoena da. Jakin nahi dugunaren proba-bilitatea da. Tipifikatu dugu, horretarako batezbestekoa kendu eta zati batezbestekoaren desbideratze tipi-koa (errore estandarra deitzen duguna) egingo dugu. Horrela, zati iluna -2.22 eta +2.22 -ren tartean dago-en kurba normalaren zatiari dagokiola ikusten dugu. Tauletan begiratu eta 0.9736ko probabilitate batgeratzen zaigu. % 97.36 kasutan nire laginketaren batezbestekoa egiazko batezbestekotik 2 unitate bainogutxiagotan urrunduko dela ikusten dugu.

Baina arazoa oraindik ez dugu bere termino justutan planteatu, zeren:

Zein da abiapuntua?

Nik ez dakit Fakultateko ikasleen pisuaren batezbestekoak zenbat balio duen, ezta bere desbideratze tipi-koa ere, eta ezagutu egin nahi ditut. Horretarako 100 pertsonako lagin bat hautatu dut eta emaitza beza-la (laginarena) batezbestekoa 72 kilo eta desbideratze tipikoa 9 kilo direla badakit. Baina hau lagineanda, benetako batezbesteko eta desbideratze tipikoa ezezagunak baitira. Eta zer egingo dut? Emaitza KON-FIANTZAZKO TARTEAN dago.

Laginaren batezbestekoa banaketa normalari jarraitzen zaio; batezbestekotzat, batezbestekoarenBENETAKO balioa (ezezaguna dena) izanik, eta desbideratze tipiko bezala errore estandarra izanik:

EE = σ √ -n. (σ ere ezezaguna da, baino σ-ren benetako balio bezala laginaren desbideratze tipikoa: s, har-tuko dugu). Orduan ondorengo grafikoa egin dezakegu, non, tauletan begiratu ondoren, kasuen % 95eanlaginaren batezbestekoa egongo den gunea marraztu dugun.

194

Page 207: Estatistika teoria eta praktika SPSSWIN erabiliz

Hau da, konfiantzazko tartea % 95, populazioaren batezbestekoaren balioa jakinik, laginaren batez-bestekoa kasuen % 95ean egongo den lekua. Edo benetan interesatzen zaidana, laginaren batezbesteko-aren balioa jakinik, populazioaren batezbestekoa kasuen % 95ean egongo den lekua.

( -X – 1.96 EE, -X + 1.96 EE)

Kontuan izan behar dugu Ê balio konstantea dela eta aldatuko dena lagina izango dela; pertsona batek100 pertsona hautatzen ditu lagin aleatorio sinple bat eginaz eta beste pertsona batek beste 100 hauta-tzen ditu, honekin laginaren pisuaren batezbestekoa aldatuko da, baina, noski, ez benetako populazioa-ren pisuaren batezbestekoa.

Deskribatzen dugun bezalako egoera batean, batezbesteko eta desbideratze tipikoaren balioaren berriez dakigula, benetan gertatuko zaidana EE-a, s deituko dugun, laginaren desbideratze tipikotik abiatuz

kalkulatu beharra izango da. Errore estandarra hau izango da: EE = σ/√-n = 9/√-1-0-0= 9/10 = 0.9.

Eta hemendik, kasuen % 95 batezbestekoaren benetako balioa hauen artean egongo dela daukagu:

(laginaren batezbestekoaten – 1.96*0.9, laginaren batezbestekoaren + 1.96*0.9)

Hemendik, konfiantza-tartea:

(-X – 1.96*0.9, -X + 1.96*0.9)

195Inferentzia. Oinarrizko kontzeptuak

*****

Page 208: Estatistika teoria eta praktika SPSSWIN erabiliz

Modu grafikoan, honek, kasuen % 95ean, batezbestekoa kalkulatzen dudanean, konfiantza tartea erai-kitzen badut, benetako batezbestekoa, lagineko batezbestekoa erabiliz eraiki dudan tartean egongo da% 95eko konfiantza-mailarekin. Kanpoan geratuko da kasuen % 5etan.

Arazo bakar bat dago.

Ikertzaileak batezbesteko bakar bat kalkulatuko du ikerketa bakoitzean, eta konfiantza-tartea % 95eaneraikitzen duenean, ez daki benetako batezbestekoa konfiantza-tartearen barruan sartzen den (kasuen% 95ean gertatuko dena) edo hanka sartzen ari ote den (kasuen % 5ean gertatuko dena) asteriskoekin(*****) adierazi dudan tartean bezala. Hau da konfiantza-tarteekin lan egiteko modua. Baina ziurragoegon nahi badut, % 99an adibidez, konfiantza-tartea luzeagoa izango da, zehaztasuna txikiagoa izangoda baina gutxiagotan nahastuko naiz. Kasu honetan, adibideko datuekin: batezbestekoa 72 eta desbide-ratze tipikoa 9 (errore estandarra 0.9).

Tarteak % 95, % 99 eta % 999 konfiantza-mailetan, hauek izango dira:

Konfiantza-maila TARTEA Errore-maila

%95 72 ± 1.96 *0.9; (70.23, 73.76) %5

%99 72 ± 2.58 *0.9; (69.67, 74.32) %1

%999 72 ± 3.30 *0.9; (69.03, 74.97) %0.1

Konfiantza-maila handituz doan neurrian, errore-maila jaisten dela ikusten dugu baina, noski! tartea-ren luzera handitzen da.

Zer egin behar dut zehaztasun handiagoa nahi badut? (tartearen luzera txikiagotu nahi badut?)

LAGINAREN TAMAINA HANDITU. Laginaren tamaina handitzen badut, eta lagina ongi aukeratzendudan guztietan, hau, lagina, populazioaren adierazgarriagoa izango dut, eta honek estimazioa gehiago“fintzen” lagunduko dit. Ekintza hau formulara itzultzen da, errore estandarra gutxituz.

Baina ZER DA KONFIANTZA-TARTE edo INTERBALOA? Definitzeko garaian gauza asko esan daitez-ke. Baina lagin aleatorio sinplea burutu eta laginaren batezbestekoa kalkulatu ondoren bi definizio emanditzaket:

1.- Emandako konfiantza-maila edo tartearekin, populazioaren batezbestekoak balio dezakeen balioenmultzoa da.

2.- Hipotesi onargarrien multzoa da. Tartean ez dauden balioak, baliagarri bezala ezingo ditut onartu.

Ondoren, estatistika inferentzialarekin erantzun ditzakegun galdera-mota ezberdinak aztertzera pasa-ko gara. Aurreko atalean aztertutako konfiantza-tarteak beste ikuspuntu batetik aurkeztuz hasiko gara.

6.2. EMAITZEN OROKORPENA: KONFIANTZA-TARTEAK

Lagin baten emaitzak populazio osoarekiko orokortu nahi ditugunean, errore-maila delakoaren arriskuazjabetu behar dugu. Errore-maila hori, ikertzen dugun populazioaren azpipopulazio bateko datuekin ibil-tzean datza eta, behaturiko emaitzak populazio-emaitzak estimatzeko baliagarriak badira ere ezin deza-kegu ziurtasun osoz populazio-emaitzak berberak direnik esan. Errore-mailak probabilitate eremura gara-matza, hots, probabilitate-hitzak erabili behar ditugu. Adibidez, lagineko subjektuen batez besteko altue-ra 155 cm-koa bada, ondorengo bi eratara mintza gaitezke. Lehena 155 cm populazioari dagokion batez-bestekoa dela esatea, eta hau arriskutsuagoa izateaz aparte ez litzateke “estatistikoegia” izango. Proze-dura horri puntu-estimazioa esaten diogu eta egiten dugun hurbilketa edo estimazioa, puntu baten balioaematea izango da.

196

Page 209: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitzak plazaratzeko bigarren forma, berriz, hau izan liteke: ikertzen dugun populazioaren altuerenbatezbestekoa 153 eta 157 cm artean dagoela eta hori % 99ko probabilitateaz dagoela esatea. Honelaeginez gero errealitatetik gertuago egoteaz gain maila estatistikoan mintzatzen garen neurrian “zintzoa-goa” ere izango da.

Azterketa-objektu den populazioaren emaitza-hurbilketaren prozedura horri Konfiantza TartekoEstimazioa esaten zaio.

Hurbilketa konfiantza-tartearen bitartez egiten dugunean, hots, konfiantza-tarteko estimazioari ekitendiogunean, ondorengo lau alderdi, zeintzuek hurbilketan eragina duten, kontuan hartu behar ditugu:

– tartearen zabalera.

– esangura edo errore-maila.

– desbideratze tipiko edo estandarra.

– laginaren tamaina.

Berehala azalduko dugunez, lau alderdi horiek elkarri loturik egongo dira.

Populazioaren errealitatera hurbildu nahi dugunean, hurbilketa hori ahalik eta zehatzena izan dadilanahi dugu; hau da, ez dugu estatistikoki ahalegin handirik egin behar populazioaren altueren batezbes-tekoa 110 eta 200 cm artekoa dela ziurtatzeko. Gure asmoa, gure helburua, konfiantza-tartearen zabale-ra ahal den txikiena izatean datza, hots, emaitzen aurkezpena ahalik eta finena izan dadila. Baina jakina,hori eta ziurtasuna kontrajarriak dira emaitzen aurkezpena egitean: altueren batezbestekoa 110 eta 200cm artekoa dela % 100eko ziurtasunez esan dezakegu; gure errore-maila % 0 dela alegia. 153 eta 157cm artean dagoela esango bagenu berriz, arrisku handiagoa edukiko genuke eta errorea izateko probabi-litatea ez litzateke zero izango. Tartearen zabalera txikiagotuko bagenu eta batezbestekoa 154-156 tarte-ari dagokiola esango bagenu ere, erratzeko probabilitatea handiagoa izango litzateke. Edozein kasutankonfiantza-tarteen gakoa zera da: zabalera txikieneko tartea izan eta errore-maila ere txikiena izatea. Erro-re-maila minimoak, du asmatzeko probabilitaterik handiena.

Zabalera txikieneko tarte eta errore-maila minimoa lortzean, darabilgun laginaren tamainak eta des-bideratze estandarrak eragina dute.

Argi dago 100.000 pertsonaz osaturiko populaziotik 100 subjektuk osatuko laginarekin lan egitendugunean, lortuko ditugun emaitzen ziurtasuna txikiagoa izango dela 10.000 pertsonako lagin batekin lanegiten dugunean baino. Arrazoia argi dago: teorikoki behintzat, 10.000 pertsonekin lortzen dugun popu-lazioen adierazgarritasuna askoz ere handiagoa izango delako. Tarte-estimazioan eragina duen azkenfaktorea, aldagaien desbideratze estandarra izango da. Herri bateko urtebeteko umeen altueren batez-bestekoaren inferentzia egiterakoan lortuko ditugun emaitzak, herri horretako 18 urte dituzten gazteenaltueren inferentziak egiterakoan baino zehatzagoak izango dira. Honen zergatia zera da: 18 urteko per-tsonen altuerak, urtebeteko umeenak baino askoz ere sakabanatuagoak izatea. Hau kontuan harturik, des-bideratze estandarra izango da konfiantza-tartearen zehaztasunean eragingo duen azken faktorea.

Aipaturiko lau alderdien artean suertatzen diren erlazio orokorrak hauek dira:

.- Zenbat eta errore-maila handiagoa, orduan eta tarte-zabalera txikiagoa.

.- Zenbat eta lagin tamaina handiagoa, orduan eta tarte-zabalera txikiagoa.

.- Zenbat eta desbideratze estandar handiagoa, orduan eta tarte-zabalera handiagoa.

Aurreko erlazio horiek beheko formulan, konfiantza-tarteen eraikuntzan klasikoenetarikoa denean,agertzen ditugu:

σKonfiantza-tartea: -X ± Tα ––––

√-n

197Inferentzia. Oinarrizko kontzeptuak

Page 210: Estatistika teoria eta praktika SPSSWIN erabiliz

Non:

-X = Laginaren batezbestekoaTα = α balio jakin batekiko, taulatan aurkituriko balioa.σ = Populazioaren desbideratze estandarra.n = Laginaren tamaina

σTartearen zabalera honako hau izango da: 2 * Tα ––––

√-n

6.3. HIPOTESI-TESTA: I. ETA II. MOTAKO ERROREAK

Argigarria izan daitekeen eguneroko bizimoduaren adibide bati loturik hipotesi-test baten planteamenduorokorra egingo dugu, geroxeago lagin bat edota lagin batzuen kasuetara zabalduko badugu ere.

Demagun pertsona bat medikuarengana doala eta, honek behaturiko sintomak direla bide, gaixoarenodol-analisiaren beharra adierazi edota emaitzen arabera ebakuntza bat behar den ala ez erabakitzenduela.

Odol-analisiak burutu ondoren, medikuak dituen datu horiekin, (demagun daukan informazio bakarradela), erabaki bat hartzera behartuta dago: pertsona honi ebakuntza egin ala ez.

Horiek horrela erabakia hartzerakoan ondorengo baliozko bi errore egin ditzake:

Lehenengoa, analisiaren emaitzak direla bide, medikuak ebakuntza ez egitea erabakitzea (beharrez-koa ez delakoan) baina benetan, errealitatean, ebakuntza behar izatea. Horri I. MOTAKO ERROREA esan-go diogu.

Bigarren errore-klasea kontrakoa izango litzateke, hots, bere gaixoak ebakuntza jasan dezala erabaki-tzea eta gaixotasuna “gezurrezkoa” izatea. Hau da, analisien emaitzak eta gaitzaren larritasunak bat ezetortzea. Errore honi II. MOTAKO ERROREA esango diogu.

Horrelako egoeran, ondoko sarrera biko taula bezalakoa egin dezakegu:

E R A B A K I A

Ebakuntza BAI Ebakuntza EZ

Bezeroak EZ du II. motako errorea Errorerik ez

ebakuntza behar

Bezeroak BAI Errorerik ez I. motako errorea

ebakuntza behar du

Dena den jakina denez, medikuak erabakitzerakoan informazio osagarriak izan ohi ditu eta horrela, I.MOTAKO ERROREA zein II. MOTAKO ERROREA ahalik eta txikienak izan daitezen saiatuko da.Inferentzi alorrean estatistika erabiltzen duena, ordea, sarritan aurkituko da honelako egoeratan.

Estatistika, erroreak (bata zein bestea) txikitzen saiatuko da. Azken finean, gure “galenoak” nahi luke-ena zera izango litzateke: operatu behar diren eta behar ez diren gaixoen arteko muga bereizgarria aur-kitzea. Beste era batera esanda, analisi-emaitzen ondorioz gaixoak bereiztu mugaren ezkerraldean edoeskuinaldean geratzen direnaren arabera. Grafikoki honela adierazi genezake:

198

EBAKUNTZAREN ALDEKO

ERABAKI-GUNEA

EBAKUNTZAREN AURKAKO

ERABAKI-GUNEA

Page 211: Estatistika teoria eta praktika SPSSWIN erabiliz

Medikuak odol-analisien arabera erabakiko balu, erabakiak hartzean ondorengo bi kasuetan erratukolitzateke: batetik, ebakuntzaren aldeko odol-analisiak izan, benetan operatu behar ez denean, (irudianezkerraldean kokaturik leudekeenak), eta ebakuntzaren kontrako odol-analisiak izanagatik, benetan ope-ratu behar denean bestetik, (irudian eskumaldean kokaturik leudekeenak).

Arestian bezala, errore-maila eta muga-kokapenaren elkarren arteko erlazioa (menpekotasuna) ageriandago. Benetan operatu behar diren pertsona guztiak opera daitezen nahi baldin badugu, erabakitze-mugaaskoz eskubialderago kokatuko genuke, baina, kasu horretan, operatu behar ez diren pertsona asko ope-ratuko lirateke. Horren arriskua handiagoa izango lukete benetan operatu behar ez direnek. Aitzitik, era-bakitze-muga ezkerrantzago kokatuko bagenu, pertsona gutxi operatzea erabakiko genuke eta, beraz,benetan behar ez duten pertsona gutxi operatuko genuke, hots, horiekin gutxitan erratuko ginateke. Halaere, beste aldetik, benetan ebakuntza behar dutenak ez operatzearen arriskua handiagotu egiten da. Izanere, erabakitze-muga dela eta, odol-analisiak probabilitate handiz ebakuntzaren kontrakoak izango baili-rateke.

Logikoa denez, erabakitze-muga tokirik egokienean kokatzea Estatistikaren eginkizuna izan behar du,hots, bi errore horiek minimoak izan daitezen edo errore horiek (I.a eta II.a) minimotzat jo ditzagun lekuaaurkitzea, alegia. Hala eta guztiz ere erroreen arteko menpekotasuna (bat txikiagotzean bestea handiago-tzea) dela medio, estatistikak hipotesi-testetan darabilen planteamendu orokorra bi erroreetako bat mini-mizatzean datza, beti ere, beste erroreak aldez aurretik ezarritako mugarik gainditzen ez duela.

Estatistikak hipotesi-testei ematen dien planteamendu orokorra honako hauxe da:

Bi errore-motei tratamendu berezia emango zaie. Bat oinarrizko edo garrantzitsuentzat joko dugu etaI. MOTAKO ERROREA esango diogu. Besteari berriz, II. MOTAKO ERROREA esango diogu. Taxuzko lanaegin ahal izateko I. MOTAKO ERROREA kontrolatuz II. MOTAKO ERROREA minimizatuko dugu. Plan-teamendu jakin bat egitean, kasu baterako, I. MOTAKO ERROREAk ez dezala % 5 edo % 1 gainditu. Baliohoriek baino txikiagoa dela ziurtaturik, II. MOTAKO ERROREA minimizatzen saiatuko gara.

Gure adibidean, planteamendua ondorengoa izan zitekeen: ebakuntza behar ez duen pertsona ope-ratzea larriagotzat jo dugu (behar ez den hanka moztea…), beste errorea (ebakuntza behar duen pertso-na ez operatzean datzana) baino. Hori horrela bada, ebakuntza behar dutenen eta ez dutenen arteanbereiz daitekeen muga non jarri erabakitzekotan, ebakuntza behar duten pertsonek operatu gabe geldi-tzeko duten arriskua % 1 baino txikiagoa izatea hartuko dugu abiapuntutzat. Errore hori aipaturiko por-tzentaia baino txikiagoa dela ziurtaturik, ebakuntza behar ez duten pertsonei ebakuntza eginaraztekodagoen arriskuaren portzentaia minimizatzen ahaleginduko gara.

Beste adibide bat, baina oraingoan korrelazio-koefizientea erabiliz. Grafiko bat erabiliz aurkeztukodizuet.

Ikus dezagun ondorengo grafikoa. Pentsa dezagun 11 subjektuko lagin bat hartu dugula, goiko diagra-man azaltzen dena. X eta Y aldagaien arteko erlazioa aztertzen badugu, ondoriozko korrelazio-koefizien-tea positiboa izango da (Xen balioa handiagotzen bada, joera Yren balio handiagoa lortzea izango da) etanahikoa handia, datuak ia lerrokatuak daudelako. Ondoriozko korrelazio-koefizientea 0.65ekoa delapentsa dezagun. Itxurazko ondorioa honakoa da: bi aldagaien artean erlazio garrantzitsu eta positiboadago.

199Inferentzia. Oinarrizko kontzeptuak

Page 212: Estatistika teoria eta praktika SPSSWIN erabiliz

Lehenengo ondorio bat atera dugu. Baina, beti egin beharreko galdera honako hau da. Zenbaterainoda posible erlazio hau “fiktizioa” eta zoriaren ondoriozkoa izatea? Hau da, zenbateraino da posible hau-tatu dugun lagina beheko populaziotik etortzea? Ikusten dugunez, populazioaren datuetan, Xen balioakaldatzean Yrenak ez aldatzeko moduan sailkatuak daude. Ez da bi aldagaien arteko erlazio garbirik ikus-ten. Aldiz, zoriak, laginaren datuek aurkakoa “froga” diezadatela lortu du.

Kasu honetan egingo dudan hipotesi-froga, lehen planteatutakoaren antzekoa, aldagaien artean erla-ziorik dagoen ala ez esatean oinarrituko da. Ez dagoenean erlaziorik badela erabakitzea, edo erlazioadagoenean ez dagoela erabakitzea. Beherago aurkezten dizudan grafikoaren kasua da. Populazioan alde-rantzizko erlazioa dago (Xen balioa handiagotzean Yrena txikiagotzeko joera), eta aldiz hautatutako lagi-nean erlazio hau ez da agertzen.

Bi errore-mota dira usuenak.

SPSSWINek lehenengoaren probabilitatea bakarrik eskainiko digu. Hau da, korrelazio-koefiziente batkalkulatzen digunean, hau zoriz lortzeko probabilitatea zein den adieraziko digu, errealitatean aldagaienartean erlaziorik ez dagoenean. Hau da, balio hau zoriz lortzeko probabilitatea. Era berean, aldagaienartean erlaziorik badagoela esaten dugunean, hau nahasteko probabilitatea da. Horrela da, nahastukonaiz, erlazio hau zoriaren emaitza izanda, korrelazio-koefiziente hau lortu duenean, eta erlazioa izateaerabaki dudanean.

1. grafikoaren kasuan adibidez. Lortutako korrelazio-koefizientea 0.65 bada, eta pakete estatistikoakbalio hori zoriz lortzeko probabilitatea 0.002koa dela adierazten badit, balio hori zoriz, milatik 2tan lor-tuko dudala aditzera ematen dit. Erlaziorik badela erabakitzen badut nahasteko probabilitatea izango da,1.000tik 2 aldi horietan, erlaziorik ez baita izango eta emaitza hau zoriz hautatua baita.

Zertxobait garbiago geratu izan dela pentsatzen dut. Ah! gogora ezazu 3. gaian nola aipatzen zen,erlazio handi eta txikiaz hitz egitean, balorazio-irizpiderik eman gabe zein lelokeria izan daitekeen.

Ondorengo kapituluetan aurreko planteamenduak nola gauzatzen diren aztertuko dugu, populazioa-ren ezaugarriak ezagutuz nahiz populazio hortatik ateratako lagin-datuez baliaturik, inferentziak egitenditugunean.

6.4. BI EDO TALDE GEHIAGOTAN LORTURIKO EMAITZEN KONPARAZIOA

Edozein ikerketa-diseinuren formulazioan populazio ezberdineko subjektuz osaturiko lagin diferenteeta-ko emaitzen arteko konparazioa ohizko eginkizuna izaten da.

Aurrera jo baino lehen bi kasu bereiztu behar ditugu:

1.- Datuak populaziokoak direnean. Beraz, ez dugu ezer inferitu behar. Izan ere, datuak neurtzen dutenezaugarria errealitate hartan adierazten baitute. Neurtzean erratzen ez bagara argi dago ez dugula ino-lako errorerik egiten.

200

Page 213: Estatistika teoria eta praktika SPSSWIN erabiliz

2.- Gure datuak populaziotik aukeratutako lagin batekoak direnean. Populazioko ezaugarri jakin bat eza-gutu ahal izateko lagin bat hautatu dugu. Hautaketa- eta neurketa-prozedura egokia bide, aztertu nahiditugun populazio-ezaugarriekiko lagina lortuko dugu. Adierazgarria ez balitz, ordea, azterketa-objek-tua den populazioarekiko ondorioak ateratzea zail samarra gertatuko litzaiguke. Era berean, gaizki egi-niko neurketak, analisi estatistiko egokiak izanagatik, alferrikako edo baliogabeko emaitzak ekarrikolizkiguke neurketa-errorea dela kausa. Oinarrizko erroreak badira ere sarri askotan egiten direnak, ira-kurlea honen garrantziaz jabe dadin nahi genuke. Aurrekoa kontuan harturik ere, emaitzak populazioosora orokortu nahi ditugunean arrisku jakin batzuen menpe gaudela jakinda ezinbestekoa dugu arris-ku horiek kontrolatzea.

Demagun, bada, behin esandakoak kontuan harturik, baserri-giroko eta kale-giroko pertsonek telebis-taren aurrean pasatzen duten ordu-kopuruen arteko diferentzia posibleak aztertu nahi ditugula. Laginakaukeratu eta populazio diferenteetako subjektuek telebista aurrean egiten duten ordu-kopuruari buruzkodatuak jasota, demagun ondoko emaitzak atera ditugula:

-Xb = 12.38 -Xk = 14.81

“Baserriko” ( -Xb) eta “kaleko” ( -Xk) taldeetako laginen bitartez lorturiko emaitzei behaturik, zera galdegenezake: ea zoriak erangindakoak diren edo, aitzitik, errealitatean baserri-girokoek telebistaren aurreankale-girokoek baino ordu gehiago pasatzen duten, datuek agertzen duten moduan.

Egingo dugun planteamendua, oro har, hipotesi-testetan egin ohi duguna izango da. Hasierako hipo-tesia ezarriz, zeinari OINARRIZKO HIPOTESIA edo BALIOGABEA esango diogun, bi populazioen artekodiferentziarik eza suposatuko dugu, hots, ikusitako diferentziak zoriak eragindakoak direla. Hipotesibaliogabearen aurrez aurre ORDEZKO HIPOTESIA edo HIPOTESI ALTERNATIBOA jarriko dugu; gurekasuan kale-giroko pertsonek telebistaren aurrean, baserri-girokoek baino ordu gutxiago egiten dutela,eta, ondorioz, ikusitako diferentziak zoriak eragindakoak ez eta benetan gertatzen den diferentzien isla-da izango litzateke.

Planteamendu orokorra, bada,

OINARRIZKO HIPOTESIA edo BALIOGABEA Ho: -Xb = -Xk

HIPOTESIA ALTERNATIBOA H1: -Xb < -Xk

Ordezko hipotesia formulatzerakoan hautabide bi izango ditugu, lehenengoa baserri-girokoordu-kopurua kale-girokoa baino handiagoa dela esatea, baina, baserri-giroko eta kale-giroko ordu-kopu-ruak diferenteak direla ordezko hipotesitzat ere jo genezake. Bi planteamendu horiek kontraste-klase bidakarkigute eta, ondorioz, errore-klase bi, ALDE BATEKOAK, adibidean guk plazaraturikoa, eta ALDEBIKOAK, hots, telebistaren aurrean pasatako ordu-kopuruen batezbestekoak diferenteak izatea ordezkohipotesitzat joko lukeena.

Arestian bi errore-motei buruz hitz egin dugu. Orain, Estatistikak adierazten duen bezala, ikus deza-gun nola erlazionatzen diren Oinarrizko hipotesia edo Baliogabea eta I. eta II. motako erroreak.

I. MOTAKO ERROREA: Hipotesi baliogabea ukatzea, hipotesi hau egia denean. Gure kasuan base-rri-giroko eta kale-giroko pertsonek telebista aurrean pasatako ordu-kopuruak diferenteak direla erabaki-tzea, eta, benetan, ikusitako diferentziak zoriak eragindakoak direnean. Hori, I. motako errorea izatearenarrisku edo probabilitatea (α izendaturikoa) izango litzateke.

II. MOTAKO ERROREA: Hipotesi baliogabea onartzea faltsua edo gezurrezkoa denean. Gure kasuantalde batek zein besteak telebistaren aurrean pasatako ordu-kopuruaren arteko diferentziak zoriak era-gindakoak direla erabakitzea baserri-girokoek, errealitatean, telebistaren aurrean ordu gehiago pasatzendutenean. II. motako errorea izatearen arrisku edo probabilitatea (β izendaturikoa) izango litzateke.

201Inferentzia. Oinarrizko kontzeptuak

Page 214: Estatistika teoria eta praktika SPSSWIN erabiliz

Aldez aurretik ikertzaileak, eta ez beste inork, erabaki behar du zein den onar lezakeen I. motako erro-rerik handiena. I. motako erroreak ezarritako muga inolaz ere ezin dezakeela gainditu onarturik, II. mota-ko errorea minimizatzen saiatuko gara. Horretarako estatistika teorikoak zenbait prozedura garatzen du;I. motako errorearen probabilitate-balio jakin bati eutsiz II. motako errorearen probabilitatea minimiza-tzeko, alegia.

SPSSWINek jarraitzen duen prozedura beti bera izango da: emaitzetan I. motako errorea izatearenprobabilitatea agertzen digu; hipotesi baliogabea egia izanda ukatzeko probabilitatea, alegia.Erabiltzaileak emaitza horretan oinarrituz, zeinerako II. motako errorea minimizatzen prozedura esta-tistikoa erabili den, erabakia zentzu batean edo bestean hartuko du. Arazo hau test edo analisi estatistikobakoitzean aztertuko dugu.

Edozein kasutan ere, Giza Zientziei Egokitutako Estatistikan sarrien erabiltzen diren errore-mailak% 5, % 1 eta milako 1 izaten dira. Lehen esan dugunez, errore-mailaren goiko muga ezartzen duena iker-tzailea izango da.

Adierazgarritasunagatiko obsesioa. Informazio galtzea

Laburra izango naiz. Zenbaitetan diferentziak edota erlazioak adierazgarriak diren edo ez diren jakiteakbakarrik kezkatzen gaitu. Hau emaitzen zati bat baino ez da. OINARRIZKOENA BATEZBESTEKOAK(BEREN DIFERENTZIAK), DESBIDERATZE TIPIKOAK AZTERTZEA ETA LAGINAREN NEURRIAK KON-TUAN IZATEA DA.

Zer esan nahi du adierazgarri edo esanguratsu izateak? Adierazgarritasun-maila, diferentzia hauek,korrelazio-koefiziente hau... zoriz lortzeko probabilitatea da, errealitatean diferentziarik ez dagoeneanedo erlaziorik ez dagoenean. Probabilitate hau % 5 baino txikiagoa denean (batzuetan % 1 baino txikia-goa eta gutxitan milatik 1 baino txikiagoa) diferentziak adierazgarriak edo erlazioa adierazgarria dela esa-ten dugu.

Puntu honetan gure emaitzen analisia amaitzea, froga estatistikoen emaitzen analisi oso mugatua egi-tea da, eta honek hipotesi-test desberdinek eskaintzen duten informazio baliagarri ugari galtzea eragitendu.

Adierazgarritasuna aztertu ondoren honen zergaitia aztertzea komeni da, bai kasu positiboan baitanegatiboan ere; hau da, adierazgarria dela ematen didanean eta ez didanean ere. Zergatik eman du adie-razgarri dela? Edo, zergatik ez du horrela eman?

Zenbaitetan batezbestekoen arteko diferentzia handiak ez dira adierazgarriak, subjektu gutxi dituda-lako edo desbideratze tipikoak oso handiak direlako. Besteetan, oso diferentzia txikiak guztiz adierazga-rriak suerta daitezke, subjektu ugari ditugulako edo desbideratze tipikoak oso txikiak direlako.

Kasu guztietan “DIFERENTZIAREN edo ERLAZIOAREN NEURRIA” aztertzera bultza nahi zaitut. Hauda, batezbestekoen diferentzia edo korrelazio-koefizientearen balioa zein den deskribatu eta aztertzea,bai adierazgarriak diren kasuetan eta ez direnetan ere.

Esandakoa beraz, gehiago aztertu, begiratu eta jo batezbestekoak, desbideratze tipikoak, koefiziente-en tamainak eta lagin-neurriak, eta garrantzi gutxiago eman adierazgarritasunari, bere garrantzia baldinbadu ere.

Test “parametrikoak” vs “ez parametrikoak”

Test ez-parametriko izenaz, parametrikoak erabiltzeko bete behar diren aplikazio-baldintzak bete beharez dituzten test-multzoa ezagutzen da. Bien frogen arteko ezberdintasun nagusiena zera da: test parame-trikoak aplikatzerakoan aldagaien normaltasuna eskatzen da eta test ez-parametrikoak erabiltzeko ez dabaldintza hau bete behar.

202

Page 215: Estatistika teoria eta praktika SPSSWIN erabiliz

Aldagaien normaltasuna ez da izango bete behar den aplikazio-baldintza bakarra. Test parametrikobakoitza aplikatzeko berari dagokion beste baldintza batzuk ere bete beharko dituzte erabiliko ditugunaldagaiek. Batzuetan, baldintza hauek oso gogorrak izango dira eta nahikoa zaila izango da denak bete-tzea. Hala ere, esan beharra dago, baldintza guztiak betetzen ez badira ere, batzuetan behintzat, lortukoditugun emaitzak baliagarriak izango direla. Aplikazio-baldintzak betetzen diren ala ez jakiteko, askotan,test ez-parametrikoez baliatuko gara.

Beraz, badakigu, gutxienez bi kasu ezberdinetarako test ez-parametrikoak baliagarriak izango direla:

– Test parametrikoak erabiltzeko bete behar diren aplikazio-baldintzak betetzen ez direnean, alternati-ba gisa.

– Test parametrikoak erabiltzeko bete behar diren baldintzak egiaztatzeko.

Test hauek, denbora luzez, test parametrikoen “ahizpa zakarrak” izan dira, baina azken bolada hone-tan eta batez ere ordenadoreak eta pakete estatistikoak oso erabilgarriak bihurtu direnetik, test hauek osogarrantzi handia hartu dute eta ondorioz asko erabiltzen dira. Aldaketa honen arrazoiak Bradley jaunakeman zituen 1968an, eta gaur egun ere ontzat dauzkagu, nahiz eta batzuk apur bat desfasatuta gelditu(batez ere programa-paketeak agertu direnetik).

1.- DEDUKZIOAREN SINPLETASUNA. Test parametrikoak ulertu eta erabiltzeko behar diren ezagupenmatematikoak, batzuetan oso astunak izango dira. Test ez-parametrikoen atzetik dagoen teoria mate-matikoa askoz ere errazagoa da.

2.- ERABILTZEKO SAMURTASUN ETA ERRAZTASUNA. Askotan test ez-parametrikoak erabiltzeko eginbehar diren eragiketak hauek izango dira: datuak ordenatu eta gero batuketak eta kenketak. (Arrazoihau adibidez, gaur egun, eta liburu honen ikuspegitik batez ere, nahikoa “pasatuta” dago, baina halaere, hemen mantendu egin dut).

3.- APLIKAZIO-ARLOAK. Test ez-parametrikoak erabiltzeko bete behar diren aplikazio-baldintzak gutxia-go eta betetzen errazagoak dira. (Hau izan daiteke gaur egun test hauek erabiltzeko dugun arrazoigarrantzitsuenetako bat; batzuetan aldagai-motagatik eta beste batzuetan test parametrikoak erabiltze-ko aldagai hauek bete behar dituzten baldintzengatik sortutako arazoak ekiditen dituelako. Bestalde,batez ere ikerketa-motagatik, askotan ezinezkoa izango da lagin handiak lortzea eta esan beharradago, lagin-kopurua N=10 baino txikiagoa denean ez dagoela test parametrikoak erabiltzerik, popu-lazioko-banaketa ezezaguna denean behintzat).

4.- APLIKAZIO-BALDINTZAK BETETZEN EZ DIRENEAN. Kasu honetan, aplikazio-baldintzak oso arrun-tak direnez gero, betetzen diren ala ez konprobatzea askoz ere errazagoa izango da. Bestalde, bal-dintza hauek betetzen ez badira, gehienetan beste test ez-parametriko bat erabiltzeko posibilitateaedukiko dugu (parametrikoetan gertatzen ez dena).

5.- BEHAR DIREN NEURKETA-MOTAK. Test ez-parametrikoak erabiltzeko, nahiz eta tarteko datuentzatere baliagarriak izan, nahikoa izango da gure datuak neurri ordinal edo koalitatibo baten bidez neur-tzea. Test parametrikoak erabiltzeko, arrazoi edo tarteko eskala batean neurtu beharko ditugu kasugehienetan.

6.- LAGINAREN TAMAINA. Laginaren tamaina 10 baino txikiagoa denean, alde batetik, test parametri-koak aplikatzea nahikoa arriskutsua izango da, eta bestetik, aplikazio-baldintza bat betetzen ez bada,test parametrikoak erabiliz lortuko ditugun emaitzak ez dira baliagarriak izango. Lagina handitzendoan heinean, test parametrikoak gero eta baliagarriagoak izango dira, eta beraz, ez-parametrikoekgarrantzia galduko dute.

Aurreko arrazoiak beste batekin osatuko ditugu, eta hau, kontzeptu berri batean oinarritzen da: TESTBATEN AHALMENA edo POTENTZIA. Ikusi dugunez edozein test estatistiko aplikatzerakoan bi erata-ko erroreak egiteko arriskua daukagu: I. ERROREA, hau da oinarrizko hipotesia egia denean gezurrez-kotzat hartzea eta II. ERROREA, oinarrizko hipotesia gezurra denean egiazkotzat ematea. I. ERROREAedukitzeko probabilitatea α letraz izendatzen genuen eta II. ERROREA edukitzeko probabilitatea β.

203Inferentzia. Oinarrizko kontzeptuak

Page 216: Estatistika teoria eta praktika SPSSWIN erabiliz

Test baten AHALMENA, π letraz izendatuko duguna, test honen oinarrizko hipotesia gezurra deneangezurtzat hartzeko daukagun probabilitatea izango da.

Beraz aurreko definiziotik, ondoko berdintasuna ezar dezakegu:

π = 1 – β

Interesatuko zaizkigun froga estatistikoak, baldintza hau betetzen dutenak izango dira: ezarri dugun αprobabilitatea baino handiagoa ez dutenak eta honekin batera β probabilitatea txikiena daukatenak,edo beste era batera esanda, I. erroreari ezarri diogun muga gainditzen ez duten testetan, testarenAHALMEN handiena daukana. Logikoki test baten AHALMENA, test horren prozedurarekin erlazio-natuta egongo da.

Aurreko kontzeptu berri honetatik test ez-parametrikoak erabiltzeko 7. arrazoia emango dugu:

7.- AHALMEN ESTATISTIKOA. Test ez-parametrikoek gutxienez parametrikoek beste ahalmen edukikodute, hauen baldintzak betetzen ez direnean.

Beraz aurreko arrazoi guztiak ikusi ondoren, laburpen gisa hau esan dezakegu:

1.- Test parametrikoen aplikazio-baldintzak betetzen direnean, hauek ez-parametrikoak baino hobeakizango dira.

2.- Test parametrikoen baldintzak betetzen ez badira, BETI ERE HOBE izango da test ez-parametriko-ak erabiltzea.

3.- Test parametrikoak erabiltzeko bete behar diren aplikazio-baldintzak aztertzeko, test ez-parametri-koak erabiliko dira.

Beraz aurreko arrazoiak ikusi ondoren test ez-parametrikoek kontuan eduki beharko ditugu.Horregatik, hurrengo gaietan T-test eta bariantza-analisiekin batera, dagokien test ez-parametrikoak iku-siko ditugu.

6.5. SUBJEKTU BATEK LORTURIKO BALIOEKIKO AURRESANA

Sarritan lagin edo populazioaren datu edo ezaugarriekin baino subjektu jakin baten datuekin lan egiteainteresgarriagoa suerta dakiguke. Horrelakoetan ondorengo bi zentzu diferenteetan sor dakizkigukeburuhausteak:

1. Subjektu bakar baten ezaugarriak direla eta, ezaugarri jakin bateko subjektu “normalen” taldeko kidebezala jo al dezakegu? Hau da, subjetu jakin batek aldagai batean emaniko balioa, dagokion popula-zioaren balio arrunt edo normal bezala har dezakegu?

2. Posible al da subjektu baten ezaugarri jakin baten balioa aurresatea subjektu berak beste ezaugarrietanemaniko emaitzetan oinarrituz?

3. Demagun populazioko subjektu guztiak hainbat klase edo kategoriatan sailkatuta dauzkagula. Guresubjektua zein sailkapeni dagokion ez dakigunean, subjektuak dituen ezaugarriak direla bide, proba-bilitate handienez zein kategoriari egokituko litzaiokeen ezagutzea izango da hirugarren arazoa.

Aurreko arazo horiei era desberdinez erantzun dezaiekegu, baina hauen baitan konfiantza-tartea etahipotesi-testak (lehenengo kasuan), konfiantza-tarteak (bigarren kasuan) edo hipotesi-testak eta sailkapen--metodoak (hirugarren kasuan) dude, kasuen arabera.

204

Page 217: Estatistika teoria eta praktika SPSSWIN erabiliz

6.6. LAGINAREN TEORIA

Estatistikaren aplikazioan, garrantzirik handienekoa, populazio bati dagozkion inferentziak egitea izangoda. Inferentzi hauek lagin batean bildutako informazioren arabera egiten dira, eta beraien helburua popu-lazioko parametro batzuk ezagutzea izango da.

Aipatutako helburuak lortzeko, garbi dago populazioa aztertzeko aukeratu dugun laginak eta popula-zioak berak, ezaugarri berdinekoak izan beharko dutela. Lagin bat aukeratzerakoan, beraz, kontuan hartubeharko dugu lagin honek populazioarekiko “ADIERAZGARRIA” izan behar duela.

Adierazgarritasun hau lortzeko bi gauza zaindu behar dira bereziki: bata, laginaren tamaina, hau da,aukeratutako pertsona- edo elementu-kopurua; eta hau erabaki ondoren, bigarrena, lagina osatzen dutenelementuen aukeraketa, zeren eta populazioko emaitzen inferentziak elementu hauetan neurtuko ditugunezaugarrien arabera egingo baititugu.

Gai honetan bi zati hauek aztertuko ditugu baina ordena aldatuz, zeren eta lagineko pertsonak hau-tatzeko erabiliko dugun metodoen arabera laginaren tamaina erabakiko baitugu.

6.6.1. Laginketa aleatorioak

Esan beharra dago laginak aukeratzeko metodoetan, aleatorioak direla populazioaren adierazgarritasunabermatzen duten bakarrak. Populaziorako inferentziak egiten ditugunean, errore batzuk edukitzeko arris-kua ere badaukagu eta laginketa-metodo hauek erabiliz errore hauek edukitzeko probabilitateak kalkuladitzakegu.

Metodo aleatorioetan garrantzitsuenak direnak aztertuko ditugu.

Laginketa aleatorio sinpleak

Metodo ezagunena, eta seguru asko gehien erabiltzen denetako bat, hau izango da, populazioko ele-mentu-kopurua oso handia ez denean batez ere.

N elementu dauzkan populazio batetik n elementuz osatutako lagin bat aukeratu behar dugu, etametodo hau erabiliz betetzen den propietatea zera da: populazioko edozein pertsonak, aukeratua izate-ko daukan probabilitatea eta beste edozeinena berdinak dira.

Praktikan, laginketa aleatorioa elementuz elementu egiten da. Aukeraketa egiteko erabiltzen den pro-zedura, askotan behintzat, ondoko hau izango da: populazioko elementu bakoitzari zenbaki bat esleitzenzaio 1etik N-raino, eta gero n zenbaki aleatorio aukeratzen dira zenbaki aleatoriozko taulak erabiliz edotaordenadoreen bidez, zenbakien serie aleatorioak ateratzen dituen programa egoki bat erabiliz. Kontuaneduki behar da, prozesuaren edozein momentutan, aukeratu gabe dauden elementuek aukeratuak izate-ko duten probabilitateak berdina izan behar duela.

Metodo honek daukan arazorik nagusiena, batez ere populazioko elementuen kopurua handia dene-an, elementuen aukeraketan, denbora asko pasa behar izatea da, eta badakigu estatistikan denborak etadiruak garrantzi handia dutela... Horregatik askotan orain aipatuko ditugun beste metodoak erabiltzendira, batez ere azkarragoak direlako.

Laginketa sistematikoa

Lagineko elementuen aukeraketa sinplifikatzen duen metodo bat da. Demagun 5.000 pertsonak osatzenduten populazio bat daukagula eta 100 pertsonen lagin bat aukeratu nahi dugula. Garbi dago popula-zioko 50 pertsonetatik bat izango dela aukeratua. Populazioko pertsona guztiei zenbaki bat esleitu ondo-ren, 1 eta 50 arteko zenbaki bat aukeratuko dugu eta zenbaki bakar hau izango da, ondoren aipatukodugun eran, laginketa osoa erabakiko duena. Demagun lortu dugun zenbakia 32 dela. Orduan popula-ziotik aukeratuko ditugun elementuak, 32, 82, 132, 182.... izango dira. Aukeraketa-prozesu hau erabil-

205Inferentzia. Oinarrizko kontzeptuak

Page 218: Estatistika teoria eta praktika SPSSWIN erabiliz

tzeko lehenengo kalkulatu behar dena GORAPEN-KOEFIZIENTEA izango da. Koefiziente honek popula-zioko elementu-kopuruaren eta lagineko elementu-kopuruen arteko zatidura adierazten du. Bere kalku-lua, noski, bi kopuruen arteko zatiketen emaitza izango da.

Prozesu honek arrisku bat dauka, populazioko elementuei zenbakiak ezartzeko erabili dugun meto-doa alegia. Adibide gisa, demagun gure populazioa osatzen duten 5.000 pertsonak 2.500 bikote (andre--gizonak) direla, eta lehenengo zenbakia beti emakumeari ezarri diogula. Hau da, zenbaki bakoitiakdauzkaten elementuak emakumeak eta bikoitiak dauzkatenak gizonak izango dira. Aukeratu dugun zen-bakia, 32, bikoitia denez, lagina osatzen duten elementu guztiak gizonezkoak izango dira, eta honenondorioz gure laginean populazioko emakumeak ez daude ordezkatuak, gure helburuen kontra noski.Benetan, arrisku handia dago eta kontuan eduki beharko ditugu era honetako serieak, populazioko ele-mentuei zenbakiak esleitzerakoan ager ez daitezen.

Laginketa geruzatua

Metodo hau erabiltzeko lehenengo pausoa, populazio guztiko elementuak zati ezberdinetan banatzeaizango da. Banaketa hau egiterakoan bilatzen dena zera da: zati bakoitzeko elementuak oso homogene-oak izatea, eta horretarako populazioari buruz aurretik daukagun informazioa erabiliko dugu.

Laginketa era honetan egiten badugu, lehenengo pausoan elementu guztiak zati homogeneo ezberdi-netan zatituko ditugu, eta ondoren, zati bakoitzeko azpilagin aleatorio bat aukeratuko dugu, azpilagin-keta hau egiteko edozein metodo aleatorio erabil dezakegula kontuan harturik.

Populazioa zatikatzean, beharrezkoa izango da irizpide argi eta garbi batzuk edukitzea, eta hauenbidez azpipopulazio bakoitzak homogeneotasun handia izan beharko du, zeren eta bestela ez baitu penamereziko honelako lana hartzerik.

Demagun estatu-mailako hauteskunde inkesta bat egin nahi dugula. Alderdi edo koalizio batzuk pro-bintzia batzuetan bakarrik aurkezten direla kontuan harturik, nahikoa logikoa dirudi, populazioa denestatu guztia probintzietan banatzeak. Eta gure populazioko laginketa bakarra egin beharrean, probintziabakoitzeko azpilagin bat aukeratuko dugu; horrela, populazio guztiko lagin adierazgarri bat lortuko bai-tugu. Kasu hauetan, populazio orokorren tratamendua emango diogu probintzia bakoitzeko populazioari.

Prozedura honek ere badu bere akats txikia: lagineko elementu-kopurua metodo hau hautatuz gero,beste metodoak erabilita baino askoz ere handiagoa izango dela gehienetan.

Lagineko elementu-kopurua aurretik mugatuta badaukagu, batzuetan arrazoi ekonomikoengatik etabesteetan denboragatik, azpipopulazio bakoitzeko azpilaginketen kopurua erabakitzerakoan bi irizpideezberdin erabiltzen dira:

.- Lortutako puntuazioen emaitzen bariantzak azpipopulazio bakoitzean berdinak badira, azpilaginbakoitzeko elementu-kopurua azpipopulazio bakoitzeko kopuruekiko proportzionala izango da.

.- Zati bakoitzeko bariantzak ezberdinak badira, azpilagineko elementu-kopurua kalkulatzerakoan, kon-tuan eduki beharko dugu zati bakoitzeko elementu-kopurua. Populazioa zenbat eta pertsona gehiagokosatu, hainbat eta pertsona gehiago egongo da laginean. Bariantza ere kontuan izan beharko dugu, etahemen ere, zenbat eta bariantza handiagoa hainbat eta pertsona gehiago laginean.

Konglomeratuen laginketa

Gehienetan, lagina aukeratzeko metodoetan, erabilterrazena hau izango da, baina arriskutsuena ere beradela esan dezakegu, zeren eta askotan nahikoa zaila izango da metodo hau erabiliz lagin adierazgarri batlortzea.

Kasu honetan laginen aukeraketa ez dugu populaziotik zuzenean egingo. Lehenengo pausoan popula-zioa azpipopulazio ezberdinetan zatituko dugu eta azpipopulazio bakoitza populazio guztiko adieraz-garritzat kontsideratuko dugu. Populazioan egin dugun zatiketa honen zati bakoitza konglomeratu batizango da eta, azken batean, lagin bezala konglomeratu bat hartuko dugu.

206

Page 219: Estatistika teoria eta praktika SPSSWIN erabiliz

Ez dugu metodo hau laginketa geruzatuarekin nahastu behar. Han, zati bakoitzetik azpilagin bat auke-ratzen genuen; hemen, ostera, lagin bezala zati oso bat hartuko dugu.

Askotan erabiltzen den adibide bat, hau da; demagun Donostian bizi diren pertsonen altueren batez-bestekoa kalkulatu nahi dugula. Kasu honetan, kale bakoitzean era guztietako altuerako pertsonak bizidirela kontuan hartuta, konglomeratu bezala kaleak kontsidera ditzakegu. Beraz, populazio guztiko laginadierazgarritzat Donostiako kale batean bizi diren pertsonak izango dira. Kalea, noski, zoriz aukeratukodugu.

Laginketa-era honek daukan arriskua zera da: batzuetan konglomeratu bateko ezaugarriak populazioosokoarekin bat ez etortzea.

Konglomeratuen laginketaren bariante bat ETAPAKO KONGLOMERATUEN LAGINKETA izango da.Horretarako lehenengo pausoan populazio guztia konglomeratu ezberdinetan zatitzen da, eta hauetatik,zoriz, bat aukeratu. Lehenengo konglomeratua aukeratu ondoren, eta honen beste zatiketa bat egin ondo-ren, lehenengo konglomeratuen adierazgarri bezala honen zati bat hartuko dugu, eta honela, behar denbeste pauso eman dezakegu.

Demagun Euskal Herriko pertsonen altueren batezbestekoa kalkulatu nahi dugula. Horretarako kon-glomeratu bezala probintziak kontsidera ditzakegu. Demagun zoriz, Gipuzkoa aukeratu dela; Gipuzkoazati ezberdinetan zatituko dugu, herrietan adibidez, eta hauetatik Donostia aukeratu da eta berdin jarraigenezake, Donostiako kalera, arestian aipatu dugun kalera, ailegatu arte.

Argi ikusten dira metodo honen arriskuak, baina aurrekoek ere badituzte bereak. Azken batean, iker-tzaileak izan beharko du, bere ahalmenak ikusirik, metodo bat edo bestea aukeratuko duena.

6.6.2. Laginketa ez-aleatorioak

Lehen aipatu dugu, populazioko lagin adierazgarri bat lortzeko metodo seguru bakarrak aleatorioak dire-la. Baina makina bat arrazoirengatik, askotan laginketa ez aleatorioetara jotzen dute ikertzaileek.Hauetatik bi bakarrik aipatuko ditugu.

Laginketa akzidentala

Giza zientzietan asko erabiltzen den metodoa da hau. Datuak lortzeko erraztasun handiena ematen dutenelementuak aukeratzen dira. Kontuan hartu behar dugu, erraztasun hitza zentzu zabalean kontsideratubehar dugula. Askotan, irakaskuntza-metodo berri bat martxan jartzerakoan, eskola edo ikastetxe piloto-ak erabiltzen dira, eta ikastetxe hauetako emaitzak konparatzeko antzeko edo ezaugarri berdinekoak kon-paratu beharko ditugu. Beste askotan, adibidez test edo neurketa-tresna batekin estatu-mailako baremoaezarri nahi badugu, diru-arazoengatik edota beste arrazoi batzuengatik ezinezkoa izango da Madrilenzehar ibiltzea; kasu hauetan laginketa aleatoriak ez du zentzurik. Kontuan hartu beharko dugu, honelaaukeratutako lagin batetik populazio osora inferentzia egin nahi badugu, lagin hauek ez direla popula-zioaren adierazgarriak.

Iritzizko laginketa

Lagineko elementuen aukeraketa populazioari buruz aurretik daukagun informazioaren arabera egingodugu. Adibidez, hauteskunde-inkesta bat egiterakoan, badakigu aurreko hauteskundeetan zer emaitzalortu diren herri ezberdinetan, eta hurrengo hauteskundeetako botuen joera jakiteko, laginen aukeraketaaurreko informazioa kontuan harturik egingo dugu.

6.6.3. Laginaren tamaina

Populazioko lagin adierazgarri bat aukeratzerakoan hartu behar den lehenengo erabakia, laginaren tamai-na izango da. Erabaki hau hartzeko, kontuan eduki beharko dugu zein laginketa-metodo erabiliko dugun.Ez da berdin izango laginketa aleatorio sinplea edo laginketa geruzatua erabiltzea.

207Inferentzia. Oinarrizko kontzeptuak

Page 220: Estatistika teoria eta praktika SPSSWIN erabiliz

Laginaren tamaina erabakitzerakoan bereiztu beharra dago populazioko elementu-kopurua finitua alainfinitua den. Zentzu hertsian, giza zientziei egokitutako Estatistikan erabiltzen diren populazioko ele-mentu-kopuruak ia beti finituak izango dira, baina hala ere, handiak direnean, infinituak bezala kontsi-deratuko ditugu. Populazioan eta laginean elementu-kopuruen arteko proportzioa 20tik 1 baino handia-goa denean, populazioaren tamaina infinitua kontsidera daitekeela esaten du zenbait adituk. Iritzi honenzergatia gero ikusiko dugu.

Hemen aipatuko ditugun kontsiderazio eta formula orokorrak laginketa aleatorio sinpleari dagozkio.

Laginaren tamaina erabakitzerakoan, batez ere populazioari buruzko hiru ezaugarri hartu behar ditu-gu kontuan:

1.- laginetik populaziorako inferentzian eduki dezakegun errore maximoa zein izango den jakin beharkodugu. Inferentzia zehatzagoak egiteko, lagin-kopurua handitu egin beharko dugu.

2.- populazioaren tamaina, ez baita berdin izango 1.000 pertsonak osatutako populaziorako ondorioakateratzea, edota 1.000.000 pertsonak osatutakorako ateratzea.

3.- populazioan neurtu nahi dugun aldagaien ezaugarrien bariantza. Hau da, lehenago esan dugun beza-la, Gipuzkoako 4 urteko umeen altuerari buruz ondorioak atera nahi baditugu, behar dugun laginaaskoz ere txikiagoa izango da, 20 urteko neska-mutilen altuerari buruzko ondorioak atera beharkobagenitu baino. Honen zergatia erraza da: 20 urteko pertsonen altuerak 4 urtekoenak baino askoz eresakabanatuagoak dira, eta, ondorioz, lagin adierazgarri bat lortzea askoz ere zailagoa izango da.

Populazio infinituko laginaren tamaina

Lehen aipatu dugun bezala, populazioaren adierazgarri izan behar duen laginaren tamaina zuzenkierlazionatuta egongo da lagin honetatik inferentzituko dugun edota konfiantza-tarteak egiten dituguneanonartuko dugun gehienezko errorearekin.

Aipatuko ditugun kasuak dira gehien erabiliak. Hau da, populazio bateko batezbestekoaren konfian-tza-tartea atera nahi dugunean, bariantza ezaguna edo ezezaguna denean, proportzioetarako konfiantza--tarteak egiteko behar ditugun lagin-kopuruak ikusiko ditugu, beti ere, gehieneko errorea mugatuz.

Hemendik aurrera populazioan neurtu ditugun aldagaien ezaugarriak banaketa normalari jarraitzenzaizkiola suposatuko dugu, bere parametroak μ eta σ izanik.

Bariantza ezaguna den populazio infinituko batezbestekoaren konfiantza-tartea eta lagin-kopurua

Demagun banaketa normalari jarraitzen zaion aldagai bat daukagula. Badakigu laginketa aleatorio bategin ondoren eta lagin horretan X aldagaia neurtu badugu, lortutako emaitzen batezbestekoa banaketanormalari jarraitzen zaiola. Lagin bateko batezbestekoaren parametroak hauek izango dira: Batez-bestekoa μ, eta desbideratze tipikoa σ/√n, n-k lagin-kopurua adierazten duelarik. Esan duguna kontuanhartuta, eta α errorea gehiengo bezala hartuta, populazioko batezbestekoentzako konfiantza-tartea hone-la defini dezakegu:

σ σ[ -X – tα ––– ≤ μ ≤ -X + tα ––– ]

√-n √-n

Hau da, α errorea mugatuz, lortu dugun konfiantza-tartearen zabalera ondoko hau izango da:

σZABALERA = 2 * tα ––––

√-n

Konfiantza-maila ezarri ondoren, demagun kasu honetan % 95 dela, banaketa normal tipikoko taule-tan aurkituko dugu tα−ren balorea, kasu honetan 1.96, bariantza edo desbideratze tipikoa ezaguna bal-din bada, demagun gure kasuan σ=10 dela. Tartearen zabalera hau izango da:

208

Page 221: Estatistika teoria eta praktika SPSSWIN erabiliz

10ZABALERA : 2 * 1.96 ––––

√-n

Lagin-kopurua 100 bada, tarteen zabalera 3.92 izango dela ikus dezakegu. Lagin-kopurua handitu egi-ten badugu, demagun bigarren kasuan 10.000 dela, lortuko dugun tartearen zabalera 0.392 izango da.Planteamendu honetan oinarrituz, lagin-kopurua erabakitzerakoan azken hitza beti ikertzaileak izangodu; beti ere noski, onartu duen errore handiena kontuan edukita.

Hala ere, ohizkoa da, estimazioaren errore edota zabaleraren emaitzak, zehaztasun-hitzetan aurkez-tea. Esan beharra dago “zehaztasuna” eta “zabalera” kontzeptu berdinak direla. Edozein estimaziotakozehaztasuna “ε” ikurra erabiliz adieraziko dugu. Gehienetan batezbestekoaren balioarekiko erabiltzen da.Era honetako esaldiak askotan ikusten dira: Batezbestekoaren estimazio bat egin dugu, batezbestekoen% 1eko zehaztasunaz.

Zehaztasun-hitzetan, emaitzak aurkeztu nahi baditugu, egin behar dugun prozesua ondokoa izangoda. Lehenengo pausoan, lagin piloto baten bidez, neurtu nahi dugun ezaugarrien lehenengo ikerketa bategingo dugu, populazioko batezbestekoen lehenengo hurbilketa lortzeko. Pauso honetan lortu dugunemaitzetan oinarrituz, azken laginketaren tamaina erabakiko dugu.

Demagun batezbestekoen lehenengo estimazioa 100 puntukoa dela, eta populazioko batezbestekoaestimatzerakoan eduki dezakegun gehiengo errorea % 5ekoa dela. Lortu behar dugun emaitzen zehazta-suna gure kasuan, batezbestekoen % 1 dela pentsatuko dugu. Hau da, gure kasuan, batezbestekoarenlehenengo estimazioa 100 dela kontuan hartuta, emaitzen zehaztasuna puntu batekoa izango da. Erahonetako ikerketa egiteko behar dugun lagin-kopurua ondoko formularen bidez kalkulatuko dugu:

σ 10ZABALERA = 2 * tα ––– = 1 = 2 * 1.96 –––

√-n √-n

eta hemendik �n = 39.2.

Honek zera esan nahi du gure laginen tamaina n = 1536.64 izango dela.

Aipatu beharra dago “zehaztasun” kontzeptua bi eratara erabiltzen dela. Batzuetan zehaztasuna etazabalera berdin erabiltzen dira, eta beste batzuetan, zehaztasun bezala zabaleraren erdia hartzen da.Adituak ez dira honetan ados jartzen. Kontuan eduki behar dugu era batera edo bestera hartu, laginarentamaina 4 aldiz handiago edo txikiagoa izango dela. Emaitzak aurkeztean kontzeptu hau zein zentzutanhartu dugun adieraztea beharrezkoa izango da.

Bariantza ezezaguna den populazio infinituko batezbestekoen konfiantza-tartea eta lagin-kopurua

Aurreko kasuan egindako planteamendu guztiak kasu honetarako ere baliagarriak izango dira. Hau da,bariantza ezaguna edo ezezaguna izan, aldatzen den gauza bakarra erabiliko dugun formula izango da.Bariantza ezezaguna denean, populazioko batezbestekoarentzako eraikiko dugun konfiantza-tartea hauizango da:

s s[ -X – tα ––– ≤ μ ≤ -X + tα ––– ]

√-n √-n

non s lagineko quasibariantzaren erro karratua den. Gogoratu beharra dago, SPSSWIN paketeak, bereemaitzetan quasibariantzaren erro karratuen balioa STD DEV izenaz azaltzen duela.

Kalkuluak eskuz egiten baditugu, laginaren kuasibariantza lortzeko bariantzaren balioan (S2) oinarri-tuz, honela kalkulatuko dugu:

n * S2s2 = ––––––––

n – 1

209Inferentzia. Oinarrizko kontzeptuak

Page 222: Estatistika teoria eta praktika SPSSWIN erabiliz

Aurkeztu ditugun bi kasu hauek, beste kasu batzuetara ere keda ditzakegu, hau da, bi populaziotakobatezbestekoak konparatu nahi ditugunean, desbideratze tipikoarentzat konfiantza-tarteak eraiki nahiditugunean.... Kasu hauetan erabiltzen diren planteamenduak berdinak izango baitira.

Aipatuko dugun bakarra, proportzioko estimazioen kasua izango da.

Proportzioentzako konfiantza-tarteak eta lagin-kopurua

Kasu honetan ere gure lagina laginketa aleatorio sinple baten bidez aukeratu dugula pentsatuko dugu.Orduan laginetik lortu dugun p proportzioen estimazioak banaketa normalari jarraitzen zaio, bere para-metroak P eta �P*Q/n direlarik, hau da:

p → N (P, �√-P*-Q-/n)

Aurreko banaketa kontuan hartuta, eta α mailako errorea gehienekoa izanik, proportzioarentzako kon-fiantza-tartea ondoko hau izango da:

√-p-q √-p-q[ p – tα ––– ≤ μ ≤ p+ tα ––– ]

√-n √-n

non p, P parametroen estimazioa den, eta q = 1 – p.

Kasu honetan tarteen zabalera honakoa izango da:

�√-p-qZABALERA = 2 * tα –––––

√-n

% 95eko konfiantza-mailarako, tα = 1.96 balioa tauletatik lortuko dugu, eta p*q-ren gehieneko balioa,p=.5 denean, 0.25 izango dela kontuan hartuta, tarteen zabalera ondoko hau izango da:

1.96ZABALERA = –––––

√-n

Eta hemendik, n = 1.962 / (zabalera)2

Tarteen zabalera mugatu ondoren lagineko tamaina lor dezakegu aurreko formula erabiliz. Aurrekokasuan bezala, emaitzak zehaztasun-hitzetan aurkeztu nahi baditugu, lehenengo pausoan, lagin pilotobatekin lana eginda, proportzioaren lehenengo estimazioa egingo dugu, eta hemen lortutako emaitzetanoinarrituz azken laginaren tamaina erabakiko dugu.

Laginaren tamaina populazio finituetan

Populazio finitu bezala, pertsona- edo elementu-kopurua finitua eta laginketa itzulera gabekoa kontsi-deratuko ditugu, nahiz eta populazioa finitua izan, laginketa itzuleraduna egiten badugu, populazio honitratamendua infinitu emango baitiogu.

Hemendik aurrera populazioko pertsona- edo elementu-kopurua N letraz adieraziko dugu eta lagin--kopurua n-ren bidez.

Populazio finitu eta infinitukoen artean dagoen ezberditasun garrantzitsuena, bariantzaren estimazio-an oinarritzen da. Populazio infinituetan lagineko kuasibariantza populazioko bariantzaren estimatzailealboragabea da. Aldiz, populazio finituetan, bariantzaren estimatzaile alboragabea ondorengo hau da:

N – n S2––––––– * –––––

N n

210

Page 223: Estatistika teoria eta praktika SPSSWIN erabiliz

non S2 lagineko kuasibariantza den. Esan beharra dago SPSSWIN paketeak kuasibariantza VARIANCEizenburuarekin aurkezten duela.

Aurreko formulan ikusten dugunez populazioaren tamaina nahiz eta finitua izan handia bada, formu-lan egiten den zuzenketa (N - n)/N, 1 baloretik oso hurbil dago. Horregatik makina bat adituk laginarentamaina aukeratzerakoan populazioaren tamaina handia bada infinitua balitz bezala kontsideratzen dute.

Batezbestekoen tartea eraikitzean, bariantza ezaguna bada, aurreko kasuaren antzekoa izango da,zeren eta kasu honetan bariantzaren estimatzailea erabiltzeak ez baitu zentzurik, ezaguna delako.

BARIANTZA EZEZAGUNA DENEAN, arestian aipatu dugun zuzenketa ezarri beharko dugu barian-tzaren estimatzailean, eta ondorioz, batezbestekoen konfiantza-tartea ondoko hau izango da:

N - n S N - n S [ -X – tα –––––– * –––– ≤ μ ≤ -X + tα ––––––– * –––– ]

N √-n N √-n

Populazio infinituetarako egin ditugun kalkulu berdinak errepikatuz, α errore maximo bezala onartzenbadugu, eraikitako tarteen luzera ondoko formulak adieraziko du:

N – n S ZABALERA = 2 * tα –––––– * –––––

N √-n

Aurreko formulan aldaketa batzuk eginik, eta tarteko zabalera A izendatuz, ondoko formularen bidezlaginen tamaina lor dezakegu:

4 * N * S2* t2αN =–––––––––––––––––––––

A2* N + 4 *S2* t2α

10.000 pertsona edo elementurekin osatutako populazio bateko batezbestekoen konfiantza-tarte bategin nahi badugu eta bariantzaren estimazioa 100 izan eta tarteen zabalera 2 puntu baino gutxiagokoaizan dadin nahi badugu, α = .05 gehiengo errorea dela, aurreko formula erabiliz aukeratu beharreko lagi-naren tamaina erabaki dezakegu:

4 * 10000 * 100 * 1.962n = –––––––––––––––––––––––––– = 369.94

22* 10000 + 4 *100* 1.962

Hau da, gure kasuan 370 elementuz osatutako lagin bat nahikoa litzateke, elementuen aukeraketalaginketa aleatorio baten bidez egin behar dugula kontuan hartuta.

Lehen aipatu dugun bezala, batzuetan ZEHAZTASUN hitzez mintzatzen da. Kasu honetan, ε zehazta-suna, zabaleraren erdia bezala onartzen dugu:

N * S2* t2αn = –––––––––––––––

ε2* N + S2* t2α

Proportzioen estimazioa populazio finituetan

Batezbestekoen tarteak eraikitzean egiten genuen bezala, proportzioen tarteak eraikitzerakoan popula-zioko bariantzaren estimatzailea alboragabea izan dadin, zuzenketa-faktore bat ezarri beharko dugu.Kasu honetan bariantzaren estimatzaile alboragabea ondoko hau izango da:

(N - n) * p * q–––––––––––––––

(N - 1) * n

Hemendik aurrera, aurreko kasuko prozedura erabiliz, α errorea eta A zabalera finkatuz eta popula-zioko tamaina N izanik, ondoko formularen bidez laginen n tamaina lortuko dugu:

211Inferentzia. Oinarrizko kontzeptuak

��� ���

���

Page 224: Estatistika teoria eta praktika SPSSWIN erabiliz

4 * N * p*q * t2αn = ––––––––––––––––––––––

A2* (N - 1) + 4 * p*q* t2α

Zabaleraz hitz egin beharrean, ε zehaztasun-hitzez ari bagara, (zehaztasuna, zabalaren erdia bezaladefinituz) laginen tamaina honako formula honek emango digu:

N * p*q * t2αn = ––––––––––––––––––––––

A2* (N - 1) + p*q* t2α

Taulak erabiliz proportzioentzako konfiantza-tarteak eta lagin-kopurua

Kasu batzuetan, taulen erabilpenak ikertzaileari halakoxe lasaitasuna ematen dio. Aurreko paragrafoetan,kasu ezberdinentzako laginaren neurrirako kalkuluaren oinarri teorikoak ikusi ditugu. Egoera bitxienetanlaginaren neurria kalkulatzeko taulen liburuak badira. Nik, hauetako baten erabileraren adibide gisa, era-bilerarik ohizkoena duena hautatu dut. Taula hau, hauteskunde aurreko zundaketa gehienetan laginarenneurria kalkulatzeko erabiltzen da. Hurrengo orrian daukazu berau. Mota honetako taulen ezaugarri guz-tiak ditu, eta bere erabilera praktikoagatik baino erabilera didaktikoagatik aurkezten dut. (Zuk kalkuluaklehen azaldu dizkizudan formulekin egin ditzakezu).

Neurri handiko (infinituko) populazioetan erabiltzeko taulaz ari gara, helburua proportzioen kalkuluadenean.

Hasierako formula, dagokion atalean jada ikusia, hau da:

√-p-qZABALERA = 2 * tα––––––

√-n

Eta hemendik, n askatuz:

4 tα2 p (1-p)n = ––––––––––––––

(zabalera)2

Azpiko taulak formula honen emaitzak aurkezten ditu, baina % 95.5 konfiantza-mailarako bakarrik,hau da tα = 2 denean.

Behin tarte-zabalera erabaki ondoren, taulak, p probabilitate bakoitzarentzako laginaren tamaina ema-ten digu. Adibidez, tartearen zabalera 0,03 baina txikiagoa izatea nahi badugu eta p = 0.50 baldin bada,ikus dezagun taula erabiliz, non aurkituko dugun laginaren tamaina. P=0.50 baldin bada, probabilitatehoni dagokion zutabea eskuin-eskuinekoa da. Eta 0.03 zabalerari dagokion lerroan,

4444 zenbakia aurkituko dugu. Hau da gure baldintzak betetzeko beharrezkoa izango den laginarentamaina. Noski, goiko formula aplikatuz, emaitza berdina lortuko dugu. Formulan balioak ordezkatzenbaditugu: tα = 2; p = 0.50; eta zabalera = 0.03; gelditzen zaigu:

4 * 22 * 0.5 * (1- 0.5) 4n = –––––––––––––––––––– = ––––––––– = 4444 elementu

(0.03)2 0.0009

Erraza, ezta?

212

Page 225: Estatistika teoria eta praktika SPSSWIN erabiliz

213Inferentzia. Oinarrizko kontzeptuak

PO

PU

LA

ZIO

INF

INIT

UK

O L

AG

INA

RE

N T

AM

AIN

A K

AL

KU

LA

TZ

EK

O T

AU

LA

: %

95.

5 ko

nfi

antz

a-m

aila

eta

lag

inke

ta a

leat

ori

o s

inp

lea

izan

ikK

2P

(1-

P)

form

ula

N =

––––

––––

(zab

aler

a)2

0.25

7500

00

1875

00

8333

3

4687

5

3000

0

2083

3

1530

6

1171

9

9259

7500

3333

1875

1200 833

612

469

370

300

208

153

117 93 75 33 19 12

0.30

8400

00

2100

00

9333

3

5250

0

3360

0

2333

3

1714

3

1312

5

1037

0

8400

3733

2100

1344 933

686

525

415

336

233

171

131

104 83 37 21 13

0.35

9100

00

2275

00

1011

11

5687

5

3640

0

2527

8

1857

7

1421

9

1123

5

9100

4044

2275

1456

1011

743

569

449

364

253

186

142

112 91 40 23 15

0.40

9600

00

2400

00

1066

67

6000

0

3840

0

2666

7

1959

2

1500

0

1185

2

9600

4267

2400

1536

1067 784

600

474

384

267

196

150

119 96 43 24 15

0.45

9900

00

2475

00

1100

00

6187

5

3960

0

2750

0

2020

4

1546

9

1222

2

9900

4400

2475

1584

1100 808

619

489

396

275

202

155

122 99 44 25 16

0.50

1000

000

2500

00

1111

11

6250

0

4000

0

2777

8

2040

8

1562

5

1234

6

1000

0

4444

2500

1600

1111

816

625

494

400

278

204

156

123

100 45 25 16

0.20

6400

00

1600

00

7111

1

4000

0

2560

0

1777

8

1306

1

1000

0

7901

6400

2844

1600

1024 711

522

400

316

256

178

131

200 79 64 28 16 12

0.15

5100

00

1275

00

5666

7

3187

5

2040

0

1416

7

1040

8

7969

6296

5100

2267

1275 816

567

416

319

252

204

142

104 80 63 51 23 13 8

0.10

3600

00

9000

0

4000

0

2250

0

1440

0

1000

0

7347

5625

4444

3600

1600 900

576

400

294

225

178

144

100 73 56 44 36 16 9 6

0.05

1900

00

4750

0

2111

1

1187

5

7600

5278

3878

2969

2346

1900 844

475

304

211

155

119 94 76

53 39 30 23 19 8 5 3

0.01

3960

0

9900

4400

2475

1584

1100 808

619

489

396

176 99 63 44 32 25 20 16 11 8 6 5 4 2 1 1

TAR

TE

ZA

BA

LER

A

0,00

2

0,00

4

0,00

6

0,00

8

0,01

0

0,01

2

0,01

4

0,01

6

0,01

8

0,02

0

0.03

0

0,04

0

0.05

0

0.06

0

0.07

0

0.08

0

0.09

0

0.10

0

0.12

0

0.14

0

0.16

0

0.18

0

0.20

0

0.30

0

0.40

0

0.50

0

Page 226: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 227: Estatistika teoria eta praktika SPSSWIN erabiliz

7. JI KARRATUAREN TESTA

7.1. KONTINGENTZI TAULAK

7.2. BANAKETA TEORIKO BATERAKO HURBILKETA

7.2.1. Ji karratuaren froga

7.2.2. Aldagai koantitatiboak. Kolmogorov-Smirnov-en testa. K.S.

Page 228: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 229: Estatistika teoria eta praktika SPSSWIN erabiliz

217

7. JI KARRATUAREN TESTA

7.1. KONTINGENTZI TAULAK. K-S FROGA

Aurreko gaian estatistika inferentzialaren zentzu zabaleko hurbilketa orokorra egin dugu. Hemendikaurrera ohizko hipotesi-testak, erabilienak, aurkeztuko ditugu, SPSSWIN paketearen erabilera-moduazein den azalduz.

Test-sorta honi hasiera emateko, Ji karratuarena, erabilienetariko bat, dakarkizuegu.

Helburuak

Ji karratuaren testaren helburu nagusiak bi dira:

1.- Bi aldagai koalitatibo edota dikotomikoren arteko erlazioa aztertzea, eta

2.- Aldagai baten banaketa banaketa teorikora zenbat hurbiltzen den aztertzea. Hau da, zenbaterainobehatutako eta itxarorando maiztasunak bat etortzen diren. (Bigarren helburu hau betetzeko gai honenamaieran K-S froga ere ikusiko dugu).

Demagun txanpon bat ondo ala gaizki egina dagoen baieztatu nahi dugula. Guretako, ondo ala gaiz-ki egina egotea, kurutx edo pil lortzeko probalitatea 0.50 izatean datza. Helburu hau lortzeko gure txan-pona airera botatzen hasi gara, eta lehenengo 10 jaurtialditan 6 pil eta 4 kurutx lortu ditugu. Teorikoki,txanpona ondo egina badago, batez beste, 5 pil eta 5 kurutx lortu behar genituzke. Beraz, alde txiki batdago lortutako kopuruen artean eta teorikoki, batez beste, lortu beharrekoetan. Aldi txiki hau zoriarenondorioz izan daitekeela garbi dago. Beraz, oraindik ezingo dugu erabaki txanpona gaizki dagoenik, etaaurrera jarraituko dugu gure esperimentuarekin, txanpona airera botaz.

100 aldiz jaurti ondoren, 60 pil eta 40 kurutx lortu ditugu. Teorikoki, txanpona ondo egina baldinbadago, 50 pil eta 50 kurutx lortu beharko genituzke, eta orain lortutakoaren eta teorian esaten digutenmaiztasunen artean dagoen aldia handiagoa da. Esan dezakegu jada, gure txanpona gaizki egina dagoe-la ala bi maiztasunen arteko diferentzia zoriaren eraginez lortutakoa izan daiteke? Hemen jada, zalantzakditugu.

Gure ikerlariak aurrera jarraitzen du, eta txanpona airera 1.000 aldiz bota ondoren, 600 pil eta 400kurutx lortu ditu. Maiztasun teorikoak, 500 pil eta 500 kurutx behar direla dio. Hemen, bi maiztasunenarteko diferentzia handiagoa da. Galdera bera da: txanpona ondo ala gaizki egina dago? Pil lortzeko dau-kagun probabilitatea 0.50 da ala ez? Zein litzateke nire erabakia kasu honetan?

Galdera honen erantzunari probabilitate bat eranstea izango da Ji karratuaren frogaren helburuetarikobat. Froga honek honakoa esango digu:

10 aldiz jaurti eta 6 pil eta 4 kurutx: Significance = 0.5271

100 aldiz jaurti eta 60 pil eta 40 kurutx: Significance = 0.0719

1.000 aldiz jaurti eta 600 pil eta 400 kurutx Significance = 0.0000

Nola irakurri behar ditugu Significance-ren emaitza hauek?

Irakurketa hau era askotara egin daiteke, denak baliokideak, eta test zehatz honen funtzionamendua,eta orokorrean guztiena, ulertzeko baliagarria izango da. Goazen, bada, era hauek ikustera.

Page 230: Estatistika teoria eta praktika SPSSWIN erabiliz

1. Significance-ren balioek emaitza hauek zoriz gertatzen direneko probabilitateak ematen dizkigute

Guk txanpona ongi dagoela pentsatzen dugu, beraz, pil eta kurutx ateratzeko probabilitatea 0.50 da.Aldiz, esperotako emaitzetatik zertxobait desberdinak diren emaitzak lortu ditugu. Lehenengo kasuanezberdintasun hau txikia da eta zorteagatik izan daitekeela iruditzen zaigu, edo probabilitate-teoriagatik;Significance = 0.5271 da, hau da emaitza hauek zorteagatik izateko probabilitatea % 52.71 da. Beraz,oso erraza da zorteagatik izatea. Beraz, ez dut esango txanpona gaizki dagoelako denik.

Gure txanpona airera jaurtitzen jarraitu dugu eta lehenengo 100 alditan 60 pil eta 40 kurutx lortu ditu-gu. Diferentzia handiak dira eta zorteagatik izatea zailagoa da. Significanceren balioak hau adierazten dit:0.0719 dela. Diferentzia hauek zoriz gertatzeko probabilitatea 0.0719koa da. Zoriz, hain diferentzia han-dia % 7 kasutan bakarrik lortuko dugu. Hau ikusi ondoren, zer esan dezakegu? Erabakia neuk hartu behar-ko dut, behin emaitzak ikusi ondoren probabilitate-teoria hemen amaitzen da, nire datuen “arrarotasu-naren” indize bat emanez.

Baina guk txanpona jaurtitzen segi dugu eta lehenengo 1.000 jaurtiketatan 600 pil eta 400 kurutx lortuditugu, oso diferentzia handia eta zortearen eraginekoa izateko zaila dirudiena. Ji karratuaren testakSignificanceren balioa 0.000 dela dio. Diferentzia hau zoriz gertatzeko probabilitatea, txanpona ongidagoenean, 0.0000 dela adierazten du. Ia nulua. Hau da, txanpon honetan pil eta kurutx ateratzeko pro-babilitatea 0.50koa bada, 1.000 jaurtiketatan 600 pil eta 400 kurutx lortzeko probabilitatea 0.0000 delaadierazten dit. Zer ondorio aterako dut oraingoan? Neronek erabaki beharko dut. Kasu honetan ere, esta-tistikaren emaitza edo Ji karratuaren testa hemen bukatzen da, halere, erantzunak garbia dirudi: txanpo-na gaizki dago.

Emaitzak irakurtzeko beste modu bat ere bada. Aurrekoarekiko baliokidea, baina Significancerenbalioa beste ikuspuntu batetik ulertzen lagun diezagukena:

2. Txanpona gaizki dagoela erabakiz gero nahasteko probabilitatea

Nire helburua txanpona gaizki edo ongi dagoen jakitea da. Azkenean honi buruzko erabaki bat hartubehar dut. Nahasteko bi kasu posibleetan dudan errore-marjina zein den jakitea interesatzen zait: hau datxanpona benetan ongi egonik gaizki dagoela erabakitzen dudanean edo txanpona benetan gaizki egonikongi dagoela erabakitzen dudanean. Baina errore-marjina bi kasuotako bakar batean bakarrik adierazikodit: hau da, errore-marjina ematen dit txanpona benetan ongi egonik, nik gaizki egina dagoela esatendudanean; bestela esanda, hipotesi nulua egia izanik baztertzen dudanean.

Lehenengo kasuan significanceren balioa 0.5271 da; horrela nik txanpona gaizki egina dagoela esa-ten badut, errore-marjin bat daukat.

Txanpona gaizki egina dagoela erabaki dut. Noiz nahastuko naiz?

Txanpona gaizki egina dagoela erabaki arren, txanpona ongi egina dagoenean nahastuko naiz etagaizki zegoela pentsatzera eraman nauten emaitza “arraroak” zoriz lortu direnean. Gure kasuan, txanpo-na airera 10 bider jaurti eta 6 pil lortzean txanpona gaizki egina dagoela erabakitzen badut, nahastekoprobabilitatea 0.5271 dela adierazten dit.

Bigarren kasuan, 100 jaurtiketatan 60 pil eta 40 kurutx lortu ditut eta txanpona ongi egonik gaizkiegina dagoela erabakitzen badut, emaitza hauek zoriz lortzen ditudanean nahastuko naiz, 0.0719ko pro-babilitatearekin, alegia.

Hirugarren kasuan, 1.000 jaurtiketatan 600 pil eta 400 kurutx lortzen ditut, txanpona gaizki eginadagoela erabakitzen badut, nahasteko probabilitatea 0.0000 da, hau da emaitza hauek zortez lortzekoprobabilitatea txanpona ongi egina dagoenean. Baina emaitza hauek zortez lortzea oso arraroa dela adie-razten dit, % 0.00 alditan.

KONTUZ! Emaitza hauek lortzea oso zaila dela adierazten dit, baina ez ezinezkoa. Ñabardura garran-tzitsua da. Kasu honetan 0 laugarren hamarrena arte dela adierazten dit, baina ez da 0 absolutua, honekemaitza ezinezkoa litzatekeela adieraziko bailidake... bada, gauza harrigarriagoak ikusi izan dira!

218

Page 231: Estatistika teoria eta praktika SPSSWIN erabiliz

Hau da Ji karratuaren planteamendua, laginean lortu ditugun emaitzak bi aldagaiak askeak liratekeenkasuan emango lituzketen emaitza teorikoekin konparatzea, hau da portzentaiak kategoria guztietankonstante mantentzen direnean.

Ikus ditzagun frogaren oinarriak eta helburuak.

Edozein ikerketatan hasierako suposizio edo hipotesian fenomeno edo gertaera baten emaitza zeinizan daitekeen adierazten dugu. Lehen ikusi dugun bezala, azterketa enpirikoa egitean, gertatutako emai-tzak eta gure oinarrizko hipotesia betetzen denean, espero ditugunak bat ez etortzea suerta daiteke. Horigarrantzitsua den ezagutzeko, edo gertatutakoak guk itxarondakotik nabarmenki aldentzen diren jakite-ko, Ji karratua delako testa erabiliko dugu.

Funtsean Ji karratua honelako eginbeharretan erabiliko dugu:

1. Bi aldagai koalitatiboren arteko erlazioen analisian.

Demagun horrelako bi aldagai ditugula: Aitaren euskara-maila (EUSKAITA) eta Amaren euskara-maila(EUSKAMA). Aldagai bakoitzak hiru kategoria ezberdin ditu: ezer ez daki, nahikoa daki, eta hirugarrenkategoria: ongi egiten du. Eta guk bi aldagai hauen arteko erlazioa aztertu nahi dugu.

Edota beste bi hauen artekoa: ikastetxe pribatu edo publikoan ikasi PUBPRIBA, eta aitaren euskara--maila EUSKAITA. Kasu honetan aztertuko duguna zera da, ia aitaren euskara-maila berdina den ikaste-txe publiko eta pribatuetan.

Azkenik, hirugarren analisi bat ere egin genezake: ikasleen sexua SEXUA eta EUSKAITA aldagaienarteko erlazioa aztertzea.

Inolako analisirik egin gabe, logikak esaten digu, EUSKAMA eta EUSKAITAren arteko erlazioa handiaizango dela, EUSKAITA eta PUBPRIBA ez hain handia, eta EUSKAITA eta ikasleen SEXUAren artekoa, txi-kia izango dela.

Atal honetan lehenengo erlazioa bakarrik aztertuko dugu; beste biak zure kontura azter ditzakezu.

Ji karratuaren bigarren eginbeharra, hau da:

2. Behaturiko datuen egokitzapena banaketa teoriko batekiko. Aldagai bat aldez aurretik jarritako bana-keta bati egokitzen zaion ala ez jakin nahi dugu hain zuzen. Adibidez, lehen erabili dugun adibide-an: txanpona ondo ala gaizki egina egon, aztertzen duguna da ia bi aukeren probabilitateak berdinakziren ala ez.

SPSSWIN erabiliz, aurreko bi azterketa-motak bi eratako aginduak erabiliz egingo ditugu; baina biak,oinarri teoriko berdinak dituzte, horregatik, nahiz eta bi kasuetako emaitzak aztertu, lehenengo kasukooinarri teorikoak bakarrik ikusiko ditugu.

Kalkuluak eskuz egiteko, ITXURAZKO bi adibide erraz planteatuko ditugu, bata aldagaien artean ela-ziorik ez dagoenekoa, hau da ez dute zerikusirik, eta bestea erlazioa oso altua dutenekoa.

Ez dago erlaziorik: ikasgai bat gainditu edo ez gainditu eta ikasleen sexua.

Badago erlazioa: amaren euskara-maila eta aitaren euskara-maila.

219Ji karratuaren testa

Page 232: Estatistika teoria eta praktika SPSSWIN erabiliz

EZ DAGO ERLAZIORIK BADAGO ERLAZIOA

AMAREN EUSKARA-MAILA

SEXUA Mutila Neska EUSKAMA EZER Nahikoa ONGI

NOTAK EUSKAITA EZ

Gainditu 40 35 75 EZER EZ 135 28 15 178

75 % 54.8 %

Ez 15 10 25 nahikoa 19 25 19 63

gainditu 25 % 19.4 %

55 45 100 ONGI 6 14 64 84

55 % 45 % 25.8 %

160 67 98 325

49.2% 20.6% 30.2%

Jarraitu aurretik, garrantzitsua da taulan sexua eta noten artean zergatik ez dagoen erlaziorik ikusteaeta aldiz eskuineko taulan badagoela ikustea. Mutilen artean gaindituen portzentaia (55etik 40) gutxigorabehera nesken portzentaiaren antzekoa (45etik 35) dela ikus dezakegu. Beste modu batean esanda,75 gaindituetatik 40 mutilak dira eta 35 neskak, eta 25 suspentsoak ere modu bertsuan banatzen dira: 15mutil eta 10 neska. Honegatik erlaziorik ez dagoela diogu. Ikaslearen sexua jakiteak ez digu bere notariburuzko informaziorik ematen, ez da nota jakiteak ere sexuari buruzko informaziorik. Edo gizonezkoaketa emakumezkoak portzentaia berdinean suspenditzen dutenik.

Kasu honi kontrajarriz, bi aldagaiek erlazioa duteneko taula ikusten dugu. Adibidez, aitak euskaraz ezdakien 178 kasutan, 135 kasutan amak ere ez daki. Eta alderantziz badakitenekin ere. Aitak euskaraz ongidakien 84 kasuetatik, 64 kasutan amak ere ongi daki. Kasu honetan, aitak euskaraz badakien edo ezdakien baldin badakigu, moduren batean, amaren euskararen berri ematen digu, edo behintzat proba-bleena izango denaren informazioa ematen digu.

Aurrera.

Behatutako maiztasunen eta teorikoen arteko diferentziak aztertuko ditugula azaldu dugu. Orain maiz-tasun teorikoak kalkulatzearen arazoa planteatzen zaigu.

Prozesua beti berdina izango bada ere, adibidea hobeto jarraitzeko lehenengo taulan oinarrituko gara:SEXUA eta NOTAK. Ikus dezagun zein den abiapuntuko balizkoa. Aldagaien artean erlaziorik ez badago,gizonezkoek eta emakumezkoek portzentaia berean gainditzen dute. Eta, orokorrean ikasleen % 75ekgainditzen duenez (100dik 75ek gainditu dute eta 25ek ez), gizonezkoen % 75ek eta emakumezkoen% 75ek ere gainditu behar lukete. % 75 hau kalkulatzea bakarrik falta zaigu. Eta oso erraza da:

Mutiletan gainditu dutenak: 55 mutilen % 75 = 0,75 * 55 = 41.25

Nesketan gainditu dutenak: 45 nesken % 75 = 0.75 * 45 = 33.75

Suspentsoentzako prozesua berdina da, orokorrean % 25ek ez dute gainditu, ondorioz, sexuak note-kin zerikusirik izan ez zezan, nesken eta mutilen portzentaia berak suspenditu behar luke.

Mutiletan gainditu ez dutenak: 55 mutilen % 25 = 0,25 * 55 = 13.75

Nesketan gainditu ez dutenak: 45 nesken % 25 = 0,25 * 45 = 11.25

Beste taulan, prozesua guztiz berdina da. Aldagai bakoitzarentzat hiru kategoria bakarrik dauzkagu.Arrazonamendua ondorengoa da: orokorrean, amen % 49.2k euskaraz ez badaki, euskara ez dakitenemakumeen portzentaia hori, aiten euskararen ezagupen-maila edo kategoria guztientzat eman beharlitzateke. Hau da, aitek euskararaz egiten ez duten 178 kasuetatik, kasuen % 49,2an amek ere ez luketejakin behar. Hau da: 178ren % 49.2 = .492 * 178 = 87.6 amek ez lukete jakin behar.

220

Page 233: Estatistika teoria eta praktika SPSSWIN erabiliz

Horrela lauki bakoitzean itxarondako maiztasunak kalkulatuz joan beharko genuke. Adibidez, aitekeuskaraz ongi egiten duten kasuetatik teorikoki euskaraz ongi egin behar luketen emakumeen kopurua,84 aitetatik % 30.2 litzateke: .302 * 84 = %25.3.

Edozein kasutan, espero ditugun maiztasunak (maiztasun teorikoak) kalkulatzeko arazoak baditugu,hauek modu zuzenean lortuko ditugu, formula hau aplikatuz:

(lerroko elementu-kopurua) * (zutabeko elementu-kopurua)Itxar.maiztasuna= –––––––––––––––––––––––––––––––––––––––––––––––––––––

elementu guztien kopurua

Prozesu hau jarraituz, aurreko taulak esperotako maiztasunekin osatuko ditugu, ondorengo taulak lor-tuaz, bertan, esperotako maiztasunak beltzez idatzi ditugularik:

EZ DAGO ERLAZIORIK BADAGO ERLAZIOA

AMAREN EUSKARA-MAILA

SEXUA Mutila Neska EUSKAMA EZER Nahikoa ONGI

NOTAK EUSKAITA EZ

Gainditu 40 35 75 EZER EZ 135 28 15 178

41.25 33.75 75 % 87.6 36.7 53.7 54.8 %

Ez 15 10 25 nahikoa 19 25 19 63

gainditu 13.75 11.25 25 % 31.0 13.0 19.0 19.4 %

55 45 100 ONGI 6 14 64 84

55 % 45 % 41.4 17.3 25.3 25.8 %

160 67 98 325

49.2% 20.6% 30.2%

Ezkerreko taulan behatutako eta esperotako maiztasunen artean dauden diferentziak eskuinaldekoe-nak baino askoz txikiagoak dira. Nota eta sexuaren kasuan ez dago ezberdintasunik, nesken eta mutilenarteko gaindituen portzentaiak antzekoak dira, ez dira portzentaiak aldatzen, edo sexuak ez dauka zeri-kusirik ikasgai zehatz bat gainditu edo ez gainditzearekin.

Aurreko kasuari kontrajarriz, eskuineko taula dugu, bertan amaren eta aitaren euskara-ezagutzarenarteko erlazioa dago. Diferentziak handiak dira. Ikus ditzagun batzuk. Alde batetik ez amak eta ez aitakeuskaraz ez dakiten 135 kasu dauzkagu, non portzentaiak mantenduko ez liratekeen kasuan (erlaziorikez egotea) 87.6 behar luketen. Beraz, aldagaien arteko erlaziorik ezean egon behar luketenak baino, eus-karaz ez dakiten emakume gehiago dago. Logikoa. Beste muturrean euskaraz ongi dakiten 64 emakumeditugu eta aitek ere badakite. 25.3 izan behar luke, banaketa proportzional batean dagokiona baino eus-karaz dakiten emakume gehiago dago. Logikoa hau ere. Justu aurkakoa gertatzen den laukiak ere badira.Amak euskaraz dakien eta aitak ez dakien 15 kasu daude, 53.7 egon behar luketenean, bitartean amekeuskaraz ez dakiten eta aitek badakiten 6 kasu daude, 41.4 kasu izan behar luketenean.

Aldagaien artean erlazioa izateak, portzentaiak ez mantentzea dakar berarekin, eta behatutako etaesperotako maiztasunen arteko diferentzien handitzea.

Baina guri, esperotako eta behatutako maiztasunen arteko diferentziak zoriz edo bi aldagaien arteanerlazioa dagoelako gertatzen den jakitea interesatzen zaigu. (Kontuan izan behar dugu beti izango direladiferentziak bien artean, txanpon bat guztiz ongi egina egonagatik ere, airera 100 aldiz jaurti eta 50 aldizpil eta 50 aldiz kurutx ateratzea ezinezkoa baita). Diferentzia horiek zoriaren ondorio zenbateraino direnaztertzeko erabiltzen dugu Ji karratuaren testa.

Horiek horrela, Ji karratua testaren planteamendu orokorra honako hau izango litzateke: behaturikomaiztasunak eta itxarondako maiztasunen artean egon badagoela diferentziarik. Diferentziak bi arrazoi-rengatik izan daitezke: zoriak eragindakoa edo abiapuntutzat jo dugun hipotesi nulua faltsua delako. Bi-

221Ji karratuaren testa

Page 234: Estatistika teoria eta praktika SPSSWIN erabiliz

garren egoera izango bagenu gure aldagaiak elkar erlazionaturik leudeke eta AITAREN euskara-mailak(EUSKAITA) baldintzatuko luke AMAREN euskara-maila (EUSKAMA), eta alderantziz ere uler genezake-en. Izan ere analisi honek ez baitu erlazioaren norabidea adierazten. Amaren euskara-mailak aitarena erebaldintzatzen du.

Estatistika teorikoak, beste aldetik, X2k estatistikoa K askatasun-graduko Ji karratuaren banaketari jarrai-

tzen zaiola esaten digu:

K = (lerro-kopurua – 1) * (zutabe-kopurua – 1)

(Oij – Eij)2X2

k = ΣΣ ––––––––––––Eij

Ji karratuaren analisien kalkuluak eskuz egiten baditugu jarraitu behar dugun prozedura hau izangoda. Behin laginaren X2

k kalkulaturik tauletara joko dugu diferentziak esanguratsuak diren ala ez jakin ahalizateko.

Gu, zuzenean programa-paketeak ematen digun emaitzak aztertzen hasiko gara.

Ikus dezagun, gu hemen aztertzen ari garen adibideak zein eratara aztertzen eta aurkezten dituenSPSSWIN programa-paketeak, ikusten ari garen bi bertsioetan.

Emaitzak lortzeko, eman ditugun pausoak hauek izan dira, LIBURU.SAV fitxategia kargatu ondoren:

EstadísticosResumir

Tablas de contingencia...

Eta era honetako pantaila lortuko dugu:

Hemen Fila(s)-era EUSKAITA pasako dugu, eta Columna(s)-era EUSKAMA. Botoi estatistikoen etagelasken aukerak aurrerago azalduko ditugunez, gainerantzekoa dagoen bezala utziko dugu. Aceptarsakatu.

222

Page 235: Estatistika teoria eta praktika SPSSWIN erabiliz

Bertsio bakoitzean lortzen ditugun emaitzak hauek dira:

SPSSWIN 6.1.3

EUSKAITA AITAREN EUSKARA-MAILA by EUSKAMA AMAREN EUSKARA-MAILA

EUSKAMA

Count

EZER EZ NAHIKOA ONGI

Row

EUSKAITA 1 2 3 Total

EZER EZ 1 135 28 15 178

54,8

NAHIKOA 2 19 25 19 63

19,4

ONGI 3 6 14 64 84

25,8

Column 160 67 98 325

Total 49,2 20,6 30,2 100,0

Number of Missing Observations: 10

Taula hau Ji karratua hipotesi-testaren abiapuntua da. Bere irakurketa oso erraza da; gurutzatu ditugunaldagaien izenak aurkezten dizkigun goiburuaren ondoren, sarrera bikoitzeko taula daukagu, lauki bakoi-tzarentzat lerro eta zutabeari dagozkien ezaugarriak dituena, bertan kokatzen diren pertsona-kopuruaaurkezten digularik. Ondoren lerro eta zutabe bakoitzaren subjektuei dagozkien portzentaiak aurkeztendizkigu. Horrela euskaraz ez dakiten 160 amak laginaren 49.2 dira, ongi egiten duten 98ak laginaren% 30.2 diren bitartean. Modu berean irakur ditzakegu portzentaiak.

7.5 bertsioak aurkezpen-formatoa zertxobait aldatzen du:

SPSSWIN 7.5

Tablas de contingencia

223Ji karratuaren testa

Resumen del procesamiento de los casos

Casos

Válidos Perdidos Total

N Porcentaje N NPorcentaje Porcentaje

AITARENEUSKARAMAILA*AMARENEUSKARAMAILA

325 97,0 % 10 3,0 % 335 100,0 %

Page 236: Estatistika teoria eta praktika SPSSWIN erabiliz

Lehenengo taulak, beti bezala, lan egingo dugun kasu-kopurua adierazten digu: 325, gure datu-matri-ze osoaren % 97. 10 kasu ditugu (galduak datuen %3a. Missing).

Hurrengo taulak, kontingentziakoak, oso irakurterreza da eta maiztasunak ilara eta zutabeetan baka-rrik aurkezten dizkigula ikus dezakegu. Honi kontrajarriz, 6.1.3 bertsioak ez dizkigu portzentaiak aur-kezten ez ileratan ezta zutabeetan ere.

Baina gure helburua aldagaien artean erlaziorik dagoen ala ez aztertzea eta berau koantifikatzea da.Lauki bakoitzeko informazioa handitzea interesatzen zaigu eta zenbait estatistiko ere eskatuko dizkiogu.Horretarako, lehendabizi “Estadísticos” botoia sakatuko dugu, eta ondorengo pantaila lortuko dugu:

Hemen, pakete honekin lan egiten dugunean sor dakigukeen “arazo”etako bat ikusten dugu: posibili-tate-kopurua. Liburu honetan errazenekin edo erabilgarrienekin lan egitera mugatuko gara. (Indize esta-tistikoetan gehiago sakondu nahi izan ezkero, Estatistika teorikoko liburuetara jotzea gomendatzen dizut).

Aurrekoa esanda, guk estatistiko erabilienak hautatuko ditugu: Ji karratua eta Kontingentzia--koefizientea. Aurrerago emaitzak topatuko dituzu.

Ji karratua (Chi-cuadrado) eskatzean, paketeak Ji karratua estatistikoaren balioa kalkulatzen digu eta,behatutako eta esperotako maiztasunen arteko diferentziak zoriz lortuak izateko probabilitatea kalkula-tzen digu.

Kontingentzia-Koefizientea (coeficiente de contingencia) eskatzean, emaitzetan balio honen emaitzaaurkeztuko digu.

224

Tabla de contigencia AITAREN EUSKARA-MAILA * AMAREN

EUSKARA-MAILARecuento

AITAREN

EUSKARA

MAILA

Total

EZER EZ

NAHIKOA,

ZAILTASUNEZ

ONGI

AMAREN EUSKARA-MAILA

EZER EZ ONGI TotalNAHIKOA,

ZAILTASUNEZ

135

19

6

160

28

25

14

67

15

19

64

98

178

63

84

325

Page 237: Estatistika teoria eta praktika SPSSWIN erabiliz

Bi balio hauekin bakarrik lan egingo dugu. Horregatik, aurreko leihoan, markatuak bi estatistiko hauekbakarrik daudela ikusten dugu.

Kontingentzia-taulen leiho orokorrera bueltatzeko: Aceptar.

Ikus ditzagun laukietako ditugun aukerak, horretarako Celdas-Casillas botoia sakatuko dut.

Eta honen antzeko pantaila bat lortuko dut:

Leiho honen bitartez, lauki bakoitzean azaltzea nahi genukeen informazioa hauta dezakegu.

Gure datuak “ikusteko”, ia guztiak interesgarriak izan baitaitezke, eskaintzen digun posibilitate bakoi-tza definitzera joko dut:

Observadas: nire laginean lortu ditudan maiztasunak.

Esperadas: aztertzen ari naizen aldagaiak erlazionaturik ez baleudeke, lauki bakoitzaren barruan espe-ro behar liratekeen maiztasun edo kasu-kopurua.

Fila: laukiko subjektuen portzentaia, ilararen totalarekiko.

Columna: laukiko subjektuen portzentaia, zutabearen totalarekiko.

Total: laukiko subjektuen portzentaia, lagineko elementuen totalarekiko.

Residuos No tipificados: behatutako eta esperotako maiztasunen arteko diferentzia. Diferentziarenemaitza positiboa bada, behatutako maiztasuna esperotakoa baino handiagoa dela esan nahi du, alda-gaiak askeak edo erlaziorik gabeak liratekeen kasuan.

Residuos Tipificados: esperotako eta behatutako maiztasunen arteko diferentziak homogeneizatzenuzten digun balioa da. Lortzeko modua: “residuos no tipificados” horiek zati esperotako maiztasunen errokarratua eginaz.

Residuos Tipificados corregidos: errore tipikoaren estimazioa egin ondoren, laukiko hondarra edo“residuoa” zati kantitate hori egiten da.

Balio hauen guztien aurrean, zein dira kasu bakoitzean eskatu behar genituzkeenak? Gure analisiare-kin lortu nahi ditugun helburuen arabera egongo da. Ikus ditzagun bi kasu, lehenengoan behatutakomaiztasunak eta portzentaia guztiak eskatzen dizkiogu, horretarako aurreko leihoan aurkeztutako auke-rak hautatu ditugu.

225Ji karratuaren testa

Page 238: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitzak hauek dira:

SPSSWIN 6.1.3

EUSKAITA AITAREN EUSKARA-MAILA by EUSKAMA AMAREN EUSKARA-MAILA

EUSKAMA

Count

Row Pct EZER EZ NAHIKOA ONGI

Col Pct Row

EUSKAITA Tot Pct 1 2 3 Total

EZER EZ 1 135 28 15 178

75,8 15,7 8,4 54,8

84,4 41,8 15,3

41,5 8,6 4,6

NAHIKOA 2 19 25 19 63

30,2 39,7 30,2 19,4

11,9 37,3 19,4

5,8 7,7 5,8

ONGI 3 6 14 64 84

7,1 16,7 76,2 25,8

3,8 20,9 65,3

1,8 4,3 19,7

Column 160 67 98 325

Total 49,2 20,6 30,2 100,0

Number of Missing Observations: 10

Kasu honetan kontingentzia-taularen leiho bakoitzean lau balio azaltzen zaizkigu.

Goiko angeluaren ezkerraldean, balio hauek azaltzen diren ordena aipatzen du. COUNT, behatutakoMaiztasuna, ROW PCT, portzentaiak ileragatik, COL PCT, portzentaiak zutabeagatik, eta TOT PCT delaadierazten digute. Aitak eta amak euskaraz ez dakiten haurrek, aitak euskaraz ez dakien totalaren % 75.8ordezkatzen du, amak euskaraz ez dakien totalaren % 84.4 ordezkatzen du eta era berean, lagin osokohaurren % 41.5 ordezkatzen du. Modu berean, aitek euskaraz nahikoa ongi hitz egiten duten eta beraienamek ongi hitz egiten duten 19 haur ere badaudela froga dezakegu. 19 haur hauek, beren aitek euskaraznahikoa(63) hitz egiten duten haur guztien % 30.2 ordezkatzen dute; era berean, beren amek euskarazongi hitz egiten duten 98 haurren % 19.4 ordezkatzen dute, eta lagina osatzen duten 325 haurren % 5.8.

Emaitza hauek berak 7.5 bertsioan aurkezteko modua zertxobait ezberdina da. Kasu honetan horrelaaurkituko dituzu:

226

Page 239: Estatistika teoria eta praktika SPSSWIN erabiliz

SPSSWIN 7.5

Tablas de contingencia

Ezberdintasun estetikoa kenduta, gainerakoa, froga dezakezunez, oso antzekoa da.

Baina lehen esan bezala, analisi honen bitartez lortu nahi dugun helburua, aldagai bien arteko erla-zioa aztertzea eta berau koantifikatzea da. Horretarako, une honetan aztertuko ditugun estatistikoenemaitzak baditugula ikusi dugu. Ondoren laukientzat behatutako eta esperotako maiztasuna eta hondarez tipifikatuak eskatu ditugun kasurako emaitzak dauzkagu. Era berean estatistiko hauek eskatu ditugu: Jikarratua eta Kontingentzia-koefizientea.

227Ji karratuaren testa

Tabla de contigencia AITAREN EUSKARA-MAILA * AMAREN

EUSKARA-MAILA

AMAREN EUSKARA-MAILA

EZER EZNAHIKOA,

ZAILTASUNEZONGI Total

AITAREN

EUSKARA-

-MAILA

EZER EZ Recuento

% de

AITAREN

EUSKARA-

-MAILA

% de

AMAREN

EUSKARA-

-MAILA

% del total

135

75,8 %

84,4 %

41,5 %

28

15,7 %

41,8 %

8,6 %

15

8,4 %

15,3 %

4,6 %

178

100,0 %

54,8 %

54,8 %

NAHIKOA,

ZAILTASUNEZ

Recuento

% de

AITAREN

EUSKARA-

-MAILA

% de

AMAREN

EUSKARA-

-MAILA

% del total

19

30,2 %

11,9 %

5,8 %

25

39,7 %

37,3 %

7,7 %

19

30,2 %

19,4 %

5,8 %

63

100,0 %

19,4 %

19,4 %

ONGI Recuento

% de

AITAREN

EUSKARA-

-MAILA

% de

AMAREN

EUSKARA-

-MAILA

% del total

6

7,1 %

3,8 %

1,8 %

14

16,7 %

20,9 %

4,3 %

64

76,2 %

65,3 %

19,7 %

84

100,0 %

25,8 %

25,8 %

Total Recuento

% de

AITAREN

EUSKARA-

-MAILA

% de

AMAREN

EUSKARA-

-MAILA

% del total

160

49,2 %

100,0 %

49,2 %

67

20,6 %

100,0 %

20,6 %

98

30,2 %

100,0 %

30,2 %

325

100,0 %

100,0 %

100,0 %

Page 240: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitzak ondorengoak dira:

SPSSWIN 6.1.3

EUSKAITA AITAREN EUSKARA-MAILA by EUSKAMA AMAREN EUSKARA-MAILA

EUSKAMA

Count

Exp Val EZER EZ NAHIKOA ONGI

Residual Row

EUSKAITA 1 2 3 Total

EZER EZ 1 135 28 15 178

87,6 36,7 53,7 54,8%

47,4 -8,7 -38,7

NAHIKOA 2 19 25 19 63

31,0 13,0 19,0 19,4%

-12,0 12,0 ,0 3

ONGI 3 6 14 64 84

41,4 17,3 25,3 25,8%

-35,4 -3,3 38,7

Column 160 67 98 325

Total 49,2% 20,6% 30,2% 100,0%

Chi-Square Value DF Significance

————————— ————— —— ——————

Pearson 161,19625 4 ,00000

Minimum Expected Frequency - 12,988

Approximate

Statistic Value ASE1 Val/ASE0 Significance

—————————— ————- ——— ———- ——————

Contingency Coefficient ,57580 ,00000

Number of Missing Observations: 10

OHARRA: Agindutako pausoak jarraitzen badituzu, lortuko dituzun emaitzetan bizpahiru lerro gehia-go, balio gehiagorekin, agertuko zaizkizu. Nik, hemen, lehenengo lerroa bakarrik ekarri dizut. Besteakliburu honen mailatik at dagoelako kendu egin ditut. Argitu dut arrazoia eta barkatu irakurle!!!

Lehendabizi, laukietan, guk gure adibidean eskuz lortutako emaitzak errepikatzen dizkigula ikus deza-kegu. Lauki bakoitzean azaltzen zaizkidan balioen ordena hau da: lehenik behatutako maiztasunak,ondoren esperotakoak eta azkenik, bien arteko diferentzia. Zalantzarik baduzu goiko angeluaren ezke-rraldean, balio hauek agertzen diren ordena azaltzen dizut (beltxez jarriak).

Ondoren Ji karratuaren frogaren emaitzak azaltzen ditu.

Azaltzen zaigun lehen balioa Pearson Value da: 161.19625

228

Page 241: Estatistika teoria eta praktika SPSSWIN erabiliz

X2aren formula aplikatzearen emaitza hau da. Gogora dezagun, aipatu formula, hau dela:

(Oij - Eij)2

X2k = ΣΣ –––––––––––––

Eij

Orokorrean hau esan dezakegu; balio hau zenbat eta handiagoa izan, handiagoa izango dela behatu-tako eta esperotako maiztasunen arteko diferentzia. Baina balio hau taulan ditugun lauki-kopuruen ara-berakoa ere izango da. Edo zehazkiago; taulako lauki askeen kopuruaren araberakoa. Balio honiaskatasun-graduak deritzo.

Askatasun-graduak(D.F.)

2 x 2 -ko taula bat oso ongi definitua geratzen da laukietako baten datua ezagutzen dugunean. Ikus deza-gun:

BAI EZ

MUTILAK 60

NESKAK 20 40

70 30

Datu bat ezagutzea aski dut (20 neskak baietz erantzun dutela), taula osoa osatu ahal izateko. BAIETZesaten duten mutilak 50 izango dira, EZETZ esaten dutenak 20, eta azkenik, EZETZ esaten duten 10 neska.

Taula osatzeko lauki bateko kasu-kopurua ezagutzea aski dudalako ASKATASUN-GRADUA duelaesango dut.

3 x 3 -ko ondorengo taulan, taula osatzeko zenbat laukiren maiztasunak ezagutu behar ditugun, gal-detzen dugu askatasun-graduak jakiteko. Erantzuna 4 da. A eta B, Araba eta Gipuzkoako ereduei dagoz-kien laukiak hautatuz froga egin dezakezu. Egin itzazu probak, adibidez lauki hauetako bakoitzean 40balioa jarriz, eta taula osatzen saia zaitez. Baina KONTUZ!! bi arazorekin topa zaitezke:

1. Adibidez, lauki horietako bakoitzean 50 balioa jartzen baduzu, ezingo duzu taula osatu. Ez da posi-ble balio horiek izatea, A ereduan 85 pertsona bakarrik baitaude.

2. Lau maiztasunak hautatzean ilara edo zutabe berdineko hiru hautatzen badituzu, ezingo duzu taula-rik osatu, baina ilara edo zutabe bakoitzeko hirugarren elementua, beti ilara edo zutabeko beste ele-mentuetatik abiatuz lor dezakezu.

A B D

Araba 120

Gipuzkoa 160

Bizkaia 100

85 135 160

Ondorioz aurreko taularen askatasun-gradua 4 da.

Orokorrean askatasun-graduen K zenbakia ondorengo formulaz baliaturik lor dezakegula baiezta gene-zake:

K = (lerro kopurua - 1) * (zutabe kopurua - 1)

Gure emaitzetan azaltzen zaigun bigarren balioa da.

229Ji karratuaren testa

Page 242: Estatistika teoria eta praktika SPSSWIN erabiliz

Significance

Ondoren, tradizionalki garrantzi handiena duen balioa azaltzen zaigu: Significance. Agian garrantzi han-diegia. Ondorengo galdera erantzuten lagunduko didan balioa da: behatutako eta esperotako maiztasu-nen diferentziak, zenbateraino arte lor litezke zoriz? Gogora dezagun planteamendua honakoa dela: dife-rentzia txikiak beti izango dira, baina hauek zoriz ala aldagaien artean erlazioa dagoelako lortuak direnargitu behar dut.

Kasu honetan Significanceren balioa .00000 da.

Emaitza zortez lortua izateko probabilitatea ia baliogabea dela adierazten digu honek. Ia ezinezkoada hain diferentzia handiak zoriagatik izatea, beraz hipotesi alternatiboaren aldeko apostua egin beharkodut, hau da, aldagaien artean erlazioa dagoelako izango da.

Significance balioaren emaitza hau “irakurtzeko” beste modu bat bada: aldagaien artean erlazioadagoela erabakitzen dudanean nahasteko probabilitatea. Ikus dezagun irakurketa honetan inplizituadagoen arrazonamendua. Guk aldagaien artean erlazioa dagoela erabakitzen dugu.

Noiz nahastuko naiz?

Bada, benetan erlaziorik ez dagoenean eta emaitzak zoriz lortu ditudanean. Baina Significancerenbalioak emaitza hauek zoriz lortzeko probabilitatea .00000 dela adierazten dit; ondorioz, nahasteko pro-babilitatea ia baliogabea, .00000, dela adierazten ari zait.

Minimum expected frequency

Aztergai ditugun aldagaiak koalitatiboak edo dikotomikoak izateaz gain, X2 testa aplikatzeko beste bal-dintzetako bat laukietan esperotako maiztasun minimoa 5 izatea da. Baldintza hau betetzen ez bazaigu,Yates-en zuzenketa egitera behartuta gaude, izan ere SPSSWINek horrela egiten du. Kasu honetan testakbaliagarria izaten jarraitzen du, baina emaitzen interpretazioak arretatsuagoa izan behar du.

Aplikazio-baldintza hau frogatzeko, esperotako maiztasun minimoa, 12,988, adierazten digun lerrohau aurkezten digu.

5 baino handiagoa denez ez dago arazorik, ez dago inolako zuzenketaren beharrik, eta aurrera jarrai-tzen dugu.

Contigency coefficient

Aldagaien artean erlazioa badagoela erabaki dugu; diferentziak ez dira zorizkoak edo zoriz lortutakoak.Baina orain, aldagaien arteko erlazio hau koantifikatzea interesatzen zaigu. Horretarako kontingentzia--koefizientea erabiliko dugu.

Azpiko blokean balio hau adierazten digu: 0.5758

Berau kalkulatzeko formula hau erabiliko dugu:

Koefiziente honen balioa 0 eta 1 artean dago. Tamainari dagokionez, bere interpretazioa korrelazio--koefizientearen antzekoa da: 0ra hurbiltzen diren balioek erlazio txikia adierazten dute, 1era hurbiltzendiren balioek erlazio oso handia adierazten duten bitartean.

Honi dagokionez gogoratu ezin dugula, zentzu zorrotzean, aldagaien arteko erlazio txiki edo handiazhitz egin. Erreferentzia-ereduak eduki behar ditugu. Adibidez, zomorro bat handia dela esateak ez digu

230

C =+ N

2

2

Χ

Χ

Page 243: Estatistika teoria eta praktika SPSSWIN erabiliz

bere tamainari buruzko ezer esaten aurreko gai baten aipatzen genuen bezala. Aparailu bat handia delaesaten dugunean ere ez dakigu orratz handi bat den, ordulari handi bat den, telebista handi bat den, hoz-kailu handi bat den, kamioi handi bat den edota .... zera handi bat den.

Gure kasuan nahikoa handia da, Gizarte-Zientzietan topatuko ditugun emaitzekiko.

Analisia amaitzen du Kontingentzia-koefizientearen balio hau zoriz lortzeko probabilitatearen emai-tza aurkeztuz (Significance): ,0000

Probabilitate hau Ji karratuaren balioaren antzekoa da, oinarri teoriko berberean lortuak daude.

Ji karratuaren analisiaren emaitzak interpretatzen ditugunean kontuan izan beharreko oinarrizko balio-ak dira hauek.

Ikus ditzagun balio hauek berak 7.5 bertsioaren formatoan aurkeztuak:

SPSSWIN 7.5

Tablas de contingencia

231Ji karratuaren testa

135 28 15 178

87,6 36,7 53,7 178,0

47,4 -8,7 -38,7

19 25 19 63

31,0 13,0 19,0 63,0

-12,0 12,0 ,0

6 14 64 84

41,4 17,3 25,3 84,0

-35,4 -3,3 38,7160 67 98 325

160,0 67,0 98,0 325,0

Recuento

FrecuenciaesperadaResidual

RecuentoFrecuenciaesperada

ResidualRecuento

Frecuenciaesperada

Residual

RecuentoFrecuenciaesperada

EZER EZ

NAHIKOA,ZALTASUNEZ

ONGI

AITARENEUSKARA--MAILA

Total

EZER EZNAHIKOA,

ZAILTASUNEZ ONGI

AMAREN EUSKARA-MAILA

Total

Tabla de contingencia AITAREN EUSKARA-MAILA * AMAREN EUSKARA-MAILA

161,196a

4 ,000

166,943 4 ,000

143,613 1 ,000

325

Chi-cuadradode PearsonRazón deverosimilitudAsociaciónlineal porlinealN de casosválidos

Valor glSig. asint.(bilateral)

Pruebas de chi-cuadrado

0 casillas (,0%) tienen una frecuenciaesperada inferior a 5. La frecuencia mínimaesperada es 12,99.

a.

,576 ,000

325

Coeficientedecontingencia

Nominal pornominal

N de casos válidos

ValorSig.

aproximada

Medidas simétricas

No asumiendo la hipótesis nula.a.

Empleando el error típico asintótico basado en lahipótesis nula.

b.

Page 244: Estatistika teoria eta praktika SPSSWIN erabiliz

Aldaketa nagusienak itxurari dagozkionak dira. Kontingentzia-taularen emaitzak aurkezten behatuta-ko emaitzekin hasten da, esperotakoekin segi eta diferentzia edo hondarrekin amaituz.

Segidan Ji karratua testaren emaitzak aurkezten dizkigu. Hiru ilaretako emaitzak baliokideak izanik,gu, lehenengo lerroan bakarrik geratuko gara, non, ordena honetan, X2 : 161.196 estatistikoaren balioaden eta, askatasun-graduak (D.F.): 4 eta azkenik adierazgarritasun-balioa aurkezten dizkigun.

X2ren bi balioren gainean, markatxo bat azaltzen zaigu (a), taularen oinean azaltzen den oharrerabidaltzen gaituena, eta esperotako maiztasun minimoa 12.99 dela esaten diguna; horregatik, frogarenaplikazio-baldintzak betetzen dira.

2. eta 3. lerroetan azaltzen diren estatistikoak, gai honetan deskribatzen ari garen Ji karratua testarianalisi osagarriak egitea ahalbidatzen duten balioak dira. Ez gara bere garapenean murgilduko, gai honenhelburuetatik at geratzen baita.

Laugarren lerroak, dauzkagun kasu onargarrien kopurua zehazten digu: 325.

Ondoren, beheko taulan, kontingentzia-koefizientearen balioa aurkezten digu: ,576 eta beronen adie-razgarritasun-maila (Aprox. Sig): ,000.

Beste adibide bat

Ondoren, gai-hasieratik garatzen ari garen beste adibidearen emaitzak aurkeztuko ditugu:

SEXUA MUTILA NESKA

NOTAK

Gainditu 40 35 75

41.25 33.75

Ez gainditu 15 10 25

13.75 11.25

55 45

Ikus ditzagun bertsio bakoitzean SPSSWINek nola aurkezten dizkigun emaitza hauek. Horretarako,eman ditugun pausoak hauek izan dira: lehenik, fitxategi BERRI bat ireki dugu, non NOTAK eta SEXUAaldagaiak definitu ondoren, 100 pertsonen datuak sartu ditugun. Egin nahi ez baduzu, hitzaurrean aipa-tutako Web orrialdeko, JIKARRA.SAV fitxategian topatuko duzu.

Ondoren pauso hauek eman ditugu:

EstadísticosResumir

Tablas de contingencia...

Eta Fila(s)-en NOTAK barne hartu dugu, Columna(s)-en SEXUA barne hartu dugun bitartean.

Estatistikoetan: Ji Karratua eta Kontingentzia-koefizientea hautatu ditugu, Continuar

Laukietan: Behatuak, Esperotakoak eta hondar ez tipifikatuak: Continuar

Aceptar

Emaitzak hauek dira:

232

Page 245: Estatistika teoria eta praktika SPSSWIN erabiliz

SPSSWIN 6.1.3

NOTAK by SEXUA

SEXUA

Count

mutila neska

Row

1,00 2,00 Total

NOTAK

1,00 40 35 75

gainditu 41.3 33.8 75,0

-1.3 1.3

2,00 15 10 25

ez gainditu 13.8 11.3 25,0

1.3 -1.3

Column 55 45 100

Total 55,0 45,0 100,0

Chi-Square Value DF Significance

—————————— ———— —— ——————

Pearson ,33670 1 ,56174

Minimum Expected Frequency - 11,250

Approximate

Statistic Value ASE1 Val/ASE0 Significance

—————————— ————- ———— ———— ——————

Contingency Coefficient ,05793 ,56174

Number of Missing Observations: 0

Emaitza hauek berak, 7.5 bertsioan honakoak dira:

SPSSWIN 7.5

Tablas de contingencia

233Ji karratuaren testa

100 100,0% 0 ,0% 100 100,0%NOTAK *SEXUA

N Porcentaje N Porcentaje N Porcentaje

Válidos Perdidos Total

Casos

Resumen del procesamiento de los casos

Page 246: Estatistika teoria eta praktika SPSSWIN erabiliz

Bi bertsioetako emaitzak baliokideak dira, formatoan izan ezik.

Azter ditzagun kasu honetan 7.5 bertsiokoak.

Lehenik, landutako kasuen azalpen labur bat aurkezten digu. Kasu honetan 100 pertsona dira laginaosatzen dutenak; datu galdurik ez dago.

234

40 35 75

41,3 33,8 75,0

-1,3 1,3

15 10 25

13,8 11,3 25,0

1,3 -1,355 45 100

55,0 45,0 100,0

Recuento

Frecuenciaesperada

ResidualRecuento

Frecuenciaesperada

Residual

RecuentoFrecuenciaesperada

gainditu

ezgainditu

NOTAK

Total

mutila neskaSEXUA

Total

Tabla de contingencia NOTAK * SEXUA

,337b

1 ,562

,121 1 ,728

,339 1 ,561

,646 ,365

,333 1 ,564

100

Chi-cuadradode PearsonCorreccióndecontinuidad

a

Razón deverosimilitud

Estadísticoexacto deFisher

Asociaciónlineal porlinealN de casosválidos

Valor glSig. asint.(bilateral)

Sig.exacta

(bilateral)Sig. exacta(unilateral)

Pruebas de chi-cuadrado

Calculado sólo para una tabla de 2x2.a.

0 casillas (,0%) tienen una frecuencia esperada inferior a 5. Lafrecuencia mínima esperada es 11,25.

b.

,058 ,562

100

Coeficientedecontingencia

Nominal pornominal

N de casos válidos

ValorSig.

aproximada

Medidas simétricas

No asumiendo la hipótesis nula.a.

Empleando el error típico asintótico basado en lahipótesis nula.

b.

Page 247: Estatistika teoria eta praktika SPSSWIN erabiliz

Ondoren bi aldagaien sarrera bikoitzeko taula aurkezten digu.

Esperotako maiztasunen eta hondarren emaitzak hamarren bakar batekin aurkezten dizkigula ikusgenazake. Honek, guk eskuz lortutako zenbait emaitzekin bat ez etortzea dakar. Bestalde, kalkuluak egi-teko garaian, hamarren guztiekin egiten ditu.

Kontingentzia-taula aurkeztu ondoren, Ji karratua testaren emaitzak aurkezten dizkigu. Gogora deza-gun, hemen interesatzen zaizkigun emaitzak lehenengo ilarari dagozkionak direla:

Ji karratua: Chi cuadrado de Pearson : .337Askatasun-graduak gl: 1Esangura (Sig. Asint): ,562

Esangura-balioa ,562 dela ikusten dugu. Honek, behatutako eta esperotako maiztasunen arteko dife-rentzia zoriz gertatzeko probabilitatea handia dela adierazten digu; beraz diferentzia hauek zortez gerta-tzea erraza da.

Emaitza hau ikusi ondoren, bi aldagaien artean erlaziorik badagoela ezingo dugu baieztatu; ezingodugu sexuak lortutako emaitzekin erlazioa duenik esan, horregatik bi aldagaien arteko ERLAZIORIK EZAmantenduz amaituko dugu. Erabaki hau, beheko taulan azaltzen den kontingentzia-koefizientearen balio-ak sendotu egiten du: ,058; 0tik oso hurbil dago, beraz ia baliogabeko erlazioaren adierazgarri da.

Aprox. Sig. (Esangura)-ren balioa, aldagaien arteko erlazioa baieztatzen badugu, nahasteko dugun pro-babilitatea bezala interpreta daitekeela genioen. Kasu honetan, erabaki hau hartuko bagenu, nahastekoprobabilitatea hau litzateke: ,562. Oso balio altua da eta honek, bi aldagaien arteko erlazioa baieztatze-ko nahikoa datu ez dugula esatera garamatza.

OHARRA: Ikusten duzunez beste estatistiko (balio) batzuek ere agertzen dira, baina liburu honen hel-buruak zeintzuk diren kontuan harturik, ez ditugu denak esplikatuko. Hemen ikusitakoak, arruntenak etaohizkoenak dira.

7.2. BANAKETA TEORIKO BATERAKO HURBILKETA: JI KARRATU ETA KOLMOGOROV-SMIRNOV(K-S)

Zenbaitetan, gure datuak banaketa teoriko batera zenbateraino hurbiltzen diren aztertu beharko dugu,hau da zenbateraino gure datuak espero genituen maiztasunetatik aldentzen diren. Behar honi erantzu-teko bi froga erabiliko ditugu. Hauek, aurreko gaian aipatu ditugun froga EZ PARAMETRIKOAK izeneko-en barnean kokatzen dira.

Aldagaien arabera bi kasu izango ditugu; modu baliokidean baina froga desberdinekin askatuko ditu-gu:

1.- Aldagaia KOALITATIBOA DENEAN, Ji karratuaren froga.

2.- Aldagaia KOANTITATIBOA DENEAN, Kolmogorov Smirnov-n froga: K-S

7.2.1. Ji Karratuaren froga

Bere erabilpena eta emaitzak lortzeko nahiz interpretatzeko modua erakutsiko digun adibide erraz batikusiko dugu jarraian.

Gaiaren hasieran txanpon bat ongi edo gaizki egina zegoen frogatu nahi genuen egoera jarri dugu adi-bidetzat. Horretarako prozedura hau erabili genuen: modu jarraian txanpona airera jaurtikitzen genueneta azaltzen ziren pil eta kurutx apuntatzen joan ondoren, emaitza hauek zoriz lortzeko probabilitateakalkulatu genuen.

Zeure ordenadorean ondorengo probabilitateak kalkulatzea proposatzen dizut:

235Ji karratuaren testa

Page 248: Estatistika teoria eta praktika SPSSWIN erabiliz

10 jaurtiketatan 6 pil, zoriz lortzeko probabilitatea 50 jaurtiketatan 30, 100etan 60 eta 1.000 jaurtike-tatan 600. Probabilitatea gutxituz doala ikus dezakezu, horregatik gero eta zailagoa izango da emaitzahoriek zoriz lortzea, eta ondorioz txanpona gaizki egina dagoela erabakitzen badut nahasteko probabili-tatea ere gutxituz joango da.

Eman beharreko pausoak, modu eskematikoan adierazita, honakoak dira: lehenik datuak sartu, eta,gero, analisia egin, azkenik emaitzak interpretatzeko. SPSSWINen bi bertsioetan prozesua berbera da;aldatuko den gauza bakarra emaitzen formatoa izango da.

1. Datuak sartzen

Irakurleak liburuaren azken zatia jadanik irakurria duela pentsatzen dut, beraz, datuak sartzeko moduaezagutuko du.

Aldagaia izendatu ondoren, TXANPONA, lortutako emaitzak edozein ordenatan sartuko ditut, 1balioa 6 aldiz eta 0 balioa 4 aldiz.

Ondoren, Ji karratuaren test ez-parametrikoaz baliatuz, probabilitatea kalkulatzeko pausoak hauekdira:

EstadísticosPruebas no paramétricas

Ji cuadrado...

Eta honen antzeko pantaila lortuko dugu:

Aldagai bezala daukagun bakarra hautatu dut egiaztatzeko: txanpona, eta “Valores esperados”en“todas las categorías iguales” aukera hautatuko dut. Aceptar.

236

Page 249: Estatistika teoria eta praktika SPSSWIN erabiliz

Lortutako emaitzak hauek dira:

SPSSWIN 6.1.3 - - - - - Chi-Square Test

TXANPONA

Cases

Category Observed Expected Residual

,00 4 5,00 -1,00

1,00 6 5,00 1,00

Total 10

Chi-Square D.F. Significance

,4000 1 ,5271

7.5 bertsioan emaitzak hauek dira:

SPSSWIN 7.5

Pruebas no paramétricas Prueba de chi-cuadrado

Frecuencias

Behatutako maiztasunen ondoren (Observed- N observado), hurrengo zutabean, esperotakoak(Expected- N esperado) aurkezten dizkigu, azkenean diferentziak (Residual) aurkeztuz amaitzeko.Arazorik ez.

Ondoren, 6 bertsioan eta 7 bertsioan, X2 estatistikoaren emaitzak aurkezten dizkigu; hauek eskuz eginnahi badituzu, formula honetaz baliatuz lortzen dela gogorarazten dizut:

Ji karratuaren emaitza lortu dugu: .40

Askatasun-graduak, lehen aipatu dugun bezala, aldagai bakar bati buruz denean kategoria-kopuruari1 kenduz lortuko ditugu. Eta azkenik, 6 pil eta 4 kurutx zoriz lortzeko probabilitatea 0.5271 da.

22 2 2

=(Oi - Ei )

Ei=

(4 -5)5

+(6 -5)

5= 0.2+0.2 = 0.4Χ ∑

237Ji karratuaren testa

4 5,0 -1,0

6 5,0 1,0

10

,001,00

Total

Nobservado

Nesperado Residual

TXANPONA ,400

1,527

Chi-cuadrado a

gl

Sig. asintót.

TXANPONA

Estadísticos de contraste

0 casillas (,0%)tienen frecuenciasesperadas menoresque 5. La frecuenciade casilla esperadamínima es 5,0.

a.

Page 250: Estatistika teoria eta praktika SPSSWIN erabiliz

Hemen amaitzen da berezko analisi estatistikoa. Orain, txanpona ongi edo gaizki egina dagoen jakinnahi izanez gero, norberari dagokio erabaki bat hartzea. Estatistikak honakoa dio: txanpona gaizki eginadagoela erabakitzen badu, nahasteko duen probabilitatea 0.5271 ekoa da. Handi samarra, ezta?

Prozesuarekin jarrai dezakezu, 50 jaurtiketa, 100 eta 1.000 eginez. Nik, jadanik egin dut eta lortu ditu-dan probabilitateen emaitzak, gai honi hasiera emateko erabili ditudanak, ematen dizkizut:

10 aldiz jaurti eta 6 pil eta 4 kurutx lortu: p = 0.527

50 aldiz jaurti eta 30 pil eta 20 kurutx lortu: p = 0.1573

100 aldiz jaurti eta 60 pil eta 40 kurutx lortu: p = 0.0719

1.000 aldiz jaurti eta 600 pil eta 400 kurutx lortu: p = 0.0000

Orokorrean, hipotesi-testekin eta bereziki Ji karratuaren frogarekin lan egiteko moduaren adierazle onbat izan daiteke.

Zer erabaki hartuko dut kasu bakoitzean?

Lehenengo kasuan oso garbi dago; nahasteko probabilitate 0.5271 izatea handia da eta, emaitza hauzoriz oso erraz lor daitekeela adierazten dit. Beraz, txanpona gaizki egina dagoenik ezin dut erabaki.

Azkenengo kasuan ere oso garbi dago; emaitza hauek zoriz lortzea ia ezinezkoa dela esaten dit. Hori,txanpona gaizki dagoelako da eta hau izango da kasu honetan hartuko dudan erabakia.

Gizarte Zientzietan, aurreko gaian aipatu dudan bezala, oro har, bi balio-muga daude: 0.05 eta 0.01.Erabaki bat edo bestea hartzeko erabiltzen diren mugak dira hauek.

Bietako edozeinekin ere, bigarren eta hirugarren kasuan ez nuke txanpona gaizki dagoenik erabakiko.Txanpona gaizki egin dagoela baieztatzeko nahikoa ebidentziarik ez dudala esanez amaituko nuke; bes-talde, txanpona jaurtitzen segituko dut, ebidentziak areagotzeko emaitzak lortzearren.

7.2.2. Aldagai koantitatiboak: Kolmogorov Smirnov-en testa. K-S

Aurreko frogaren logika berarekin jarraituz, zenbaitetan aldagai batek sailkapen teoriko bati jarraitzen otezaion frogatzea interesatuko zaigu.

Froga hau, zenbait kasutan, beste froga batzuen aurretik egitea, ezinbestekoa da froga batzuek, berenaplikaziorako, baldintza bezala erabiliko dugun aldagaiak banaketa normalari jarraitzea eskatzen baitu-te.

Demagun matematikako frogaren emaitzekin lan egin nahi dugula, eta honen sailkapena kurba nor-malera atxikitzen den jakin behar dugula.

Horretarako, lehendabizi aldagaiaren histograma lor dezakegu. Hemen aurkezten duguna, honakopauso hauek eman ondoren lortutakoa da:

GráficosHistograma...

“Variable”n MATEMATI hartzen dugu, eta Mostrar curva normal aukera eragiten dugu. Aceptar.

238

Page 251: Estatistika teoria eta praktika SPSSWIN erabiliz

Ondorengo grafikoa lortzen dugu:

Behatutako maiztasunen (histograma) eta maiztatu teorikoen (kurba normala) artean diferentziak dau-dela ikus dezakegu (histograma eta kurba normala bata bestearen gainean jarrita). Gure galdera, gai osoanzehar egiten ari garena bera da: Zenbateraino izan daitezke diferentzia hauek zorizkoak? Edo beste hau,diferentzia hauek izanda ere, baiezta al dezaket gure datuek kurba normala darraitela? edo, bestalde, dife-rentzia hauek aipatutako hipotesia alboratzeko adina garrantzi ba ote dute?

Galdera hauek erantzuteko Kolmogorov-Smirnoven testa erabiliko dugu.

Ikus dezagun, lehenik, nola lor ditzakegun emaitzak eta, ondoren, bere interpretazioa aztertzera pasa.

Emaitzak lortzeko eman behar ditugun pausoak hauek dira:

EstadísticosPruebas no paramétricas

K-S de 1 muestra...

Eta honen antzeko leiho bat lortuko dugu, non Contratar variables bezala: MATEMATI hautatu dugun;“distribución de contraste”n berriz, Normal-en botoia sakatuko dugu. Kasu honetan froga honen auke-rak ez ditut beharrezkoak ikusten, beraz defektuz datozenak onartuko ditugu.

239Ji karratuaren testa

Page 252: Estatistika teoria eta praktika SPSSWIN erabiliz

Lortutako emaitzak ondorengoak dira:

SPSSWIN 6.1.3 - - - - - Kolmogorov - Smirnov Goodness of Fit Test

MATEMATI

Test distribution - Normal Mean: 23,89

Standard Deviation: 4,82

Cases: 329

Most extreme differences

Absolute Positive Negative K-S Z 2-Tailed P

,06768 ,03559 -,06768 1,2276 ,0982

7.5 bertsiorako:

SPSSWIN 7.5

Pruebas no paramétricas

Emaitzen irakurketa oso da erraza. Bi bertsioetan oso antzekoa da, itxuran izan ezik.

Lehenik MATEMATI aldagaia deskribatzen digu:

Batezbestekoa (Mean/Media): 23.89, Desbideratze tipikoa (Std.Deviation/Desviación típica): 4.82. 7.5 bertsioak azken informazio hau osatu egiten digu aldagaiaren balio txiki eta handienak emanez.

Batezbestekoaren eta desbideratze tipikoaren balio hauek (23.89 eta 4.82), era berean, kurba norma-laren banaketa teorikoa lortzeko erabiliko dira.

Gure galdera honakoa da: Zenbateraino izan daitezke zorizkoak behatutako maiztasunen eta maiz-tasun teorikoen (kurba normalaren kasukoen) arteko diferentziak?

Lehenengo, diferentzia hauek zehazten dizkigu: Diferentzia absoluturik handiena (Absolute):0.06768; diferentzia positiborik handiena (positive): 0.03559 eta diferentzia negatiborik handiena (nega-tive): 0.06768 (kasu honetan diferentzia absoluturik handienarekin bat datorrena). 7.5 bertsioan, emaitzakaurkezteko, zifra hauek 3 hamarrenera borobiltzen dira.

240

32923,89

4,82

,068,036

-,068

1,228

,098

N

MediaDesviación típica

Parámetros normales a,b

Absoluta

PositivaNegativa

Diferencias másextremas

Z de Kolmogorov-Smirnov

Sig. asintót. (bilateral)

MATEMATI

Prueba de Kolmogorov-Smirnov para una muestra

La distribución de contraste es la Normal.a.

Se han calculado a partir de los datos.b.

Page 253: Estatistika teoria eta praktika SPSSWIN erabiliz

Gure galdera erantzun aurretik, Kolmogorov-Smirnoven Z estatistikoaren balioa (1.2276) eta balio hauzoriz lortzeko probabilitatea (0.0982) aurkezten dira.

Probabilitate honen interpretazioa, gai osoan zehar aztertu dugun Significance balioaren antzekoa da.Lortutako diferentziak oso handiak ez direla zehazten digu eta gainera, gure datuek kurba normalari segi-tzen zaizkionaren hipotesia baztertzen dudanean % 9.82tan nahastu egingo naizela adierazten dit. Errorehandia dirudi; beraz, gure datuak kurba normalari darraizkiotela onar dezaket.

Eta honekin amaitzen da K-S testaren interpretazioa.

Amaitzeko, froga honek datu-multzo batek beste bi sailkapen teorikotan izan dezakeen doikuntzaaztertzen ere uzten didala adierazi nahi nuke: sailkapen uniformean eta Poisson-en sailkapenean, hainzuzen ere.

241Ji karratuaren testa

Page 254: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 255: Estatistika teoria eta praktika SPSSWIN erabiliz

8. BATEZBESTEKOEN KONPARAKETA

8.1. POPULAZIOEN BATEZBESTEKOEN DESKRIBAPEN ETA KONPARAKETA

8.2. 2 LAGINEKO BATEZBESTEKOEN DESKRIBAPEN ETA KONPARAKETA

8.2.1. Lagin edo neurri askeak. Student-en T

8.2.2. Neurri errepikatu edo erlazionatuak. Student-en T

8.2.3. Lagin edo neurri askeak. Mann-en U

8.2.4. Neurri errepikatu edo erlazionatuak. Wilcoxon-en W

Page 256: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 257: Estatistika teoria eta praktika SPSSWIN erabiliz

245

8. BATEZBESTEKOEN KONPARAKETA

Bigarren gaian aldagaien deskribapena landu da. Deskribapen-prozesuaren barnean banaketaren erdi-puntua zein den konturatzen lagunduko digun indize ezberdinekin lan egin da; indize hauek zentraliza-ziokoak dira. Hauen artean erabiliena batezbestekoa da.

Gai honetan pauso bat gehiago emango dugu eta talde, maila edo kolektibo ezberdinetako emaitzak(batezbestekoak), edo, bere kasuan, talde berean baina behin eta berriz lortu diren emaitzak konparatu-ko ditugu.

Aurreko gaietan bezalaxe, oinarrizko galdera bat dago. Galdera honen erantzunak arazoari buruzegingo dugun planteamendua eta, ondorioz, bere erantzuna baldintzatuko ditu. Galdera ondorengo hauda.

Populazio osoarekin ari naiz lanean ala, lagin bateko datuak izanik, nire emaitzak ordezkari egokiakdirela pentsatzen dut eta populazio osora orokortu nahi ditut?

Nire kasua lehenengoa bada, hau da, populazio osoarekin lan egiten badut, prozesua oso sinpleaizango da. Esku artean dudan errealitatea DESKRIBATZEA da helburua eta horretarako konparatu nahiditudan talde, maila edo kolektibo bakoitzeko emaitzak AURKEZTUKO ditut. Estatistika DESKRIBA-TZAILEaren kasu bat da.

Bigarren kasuan, emaitzak aurkezteaz gain, erabilitako laginek ordezkatzen dituzten populazio edokolektiboetara emaitzak orokortzen saiatuko naiz. Kasu honetan, 6. gaian ikusi dugun bezala, erroreakegin ditzaket orokortze-prozesuan, laginaren hautaketa-prozesuan oinarrituak batik bat.

Batezbestekoen konparaketaren alderdi deskribatzaile edo inferentziala argitu eta berau egiteko pro-zedura egokia hautatu aurretik, gure datuek ustezko normaltasuna zenbateraino betetzen duten balora-tzea beharrezkoa da. 6. gaian aztertu dugun bezala, bi froga-mota dauzkagu: PARAMETRIKOAK ETA EZ--PARAMETRIKOAK. Gai honetan, bi froga hauen emaitzak lortzeko modua, berauen interpretazioa edotalan egiteko modua aztertuko ditugu.

Aurreko hausnarketetan oinarrituz, gaiaren ardatzak hauek izango dira:

a) POPULAZIOEN BATEZBESTEKOEN DESKRIBAPEN ETA KONPARAKETA

b) 2 LAGINEKO BATEZBESTEKOEN DESKRIBAPEN ETA KONPARAKETA

Hurrengo gairako utziko dugu bi talde baino gehiagoko kasuan batezbestekoen konparaketaren oro-kortzea, hau Bariantza-analisi sinplearen bitartez egingo dugularik.

Bestalde, gai honetan, taldeak egiteko sailkapen-irizpide bakar bat erabili dugu (FAKTORE BAT).Hurrengo gairako utziko dugu sailkapen-irizpide bat baino gehiago erabiliko deneko kasua ere (2 edoFAKTORE gehiago), hau Bariantzaren Analisi Faktorialaren bitartez askatuko dugularik.

Sarreran aurkeztutako adibidearekin lan egingo dugu gai osoan. Emaitzak SPSS-WINDOWSekin lor-tzeko, datuak eta aldagaiak definituak ditugun puntutik abiatuko gara. Emaitzak nola lortu eta interpreta-tu behar diren azalduko dizugu, bai 6.1.3 bertsioan eta baita 7.5 bertsioan ere.

8.1. POPULAZIOEN BATEZBESTEKOEN DESKRIBAPEN ETA KONPARAKETA

Kasurik sinpleena eta errazena da hau. 3. kapituluan jada planteatu dugunez, adibide haren laburpen txikibat baino ez dut egingo hemen.

Page 258: Estatistika teoria eta praktika SPSSWIN erabiliz

Kasu honetan lagineko 335 pertsonei buruz zerbait jakin nahi dugula suposatuko dugu. Emaitzak ezditugu beste ikasle batzuetara, beste ikastetxeetara, beste lekuetara edota beste uneetara orokortu nahi.Gure datuak aztertu nahi dugun populazioari dagozkiola suposatuko dugu.

Oso egoera sinple bat ezar dezagun.

Nesken eta mutilen arteko matematikako frogaren (MATEMATI) emaitzak konparatu nahi ditut. Edofroga honen emaitzak Gipuzkoa, Araba, Nafarroa eta Bizkaian konparatu nahi ditut.

LIBURU.SAV fitxategia kargatu ondoren, gure taldeak deskribatu ahal izateko eman behar ditudanpausoak hauek dira:

EstadísticosComparar medias

Medias...

Eta ondorengo leihoa lortuko dugu:

Leiho honetan, menpeko zerrendan MATE-MATI aldagaia hautatu dugu, eta zerrenda aske-an, berriz, SEXUA eta PROBINTZ.

Opciones-en botoia sakatzen badugu, leihohau lortuko dugu 7.5 bertsioan (6.1.3 bertsiokoaere oso antzekoa da).

Modu batera edo bestera, eskuineko zutaberapasatzen ditut hiru estatistiko garrantzitsuenak:Batezbestekoa, kasu- edo maiztasun-kopuruaeta desbideratze tipikoa.

Continuar sakatu eta ondoren, Aceptar.

246

Page 259: Estatistika teoria eta praktika SPSSWIN erabiliz

Bertsio bakoitzean lortutako emaitzak hauek dira:

SPSSWIN 6.1.3

- - Description of Subpopulations - -

Summaries of MATEMATI

By levels of SEXUA

Variable Value Label Mean Std Dev Cases

For Entire Population 23,9608 4,7091 306

SEXUA 1 GIZONA 23,9508 5,0220 122

SEXUA 2 EMAKUMEA 23,9674 4,5037 184

Total Cases = 335

Missing Cases = 29 or 8,7 Pct

- - Description of Subpopulations - -

Summaries of MATEMATI

By levels of PROBINTZ

Variable Value Label Mean Std Dev Cases

For Entire Population 23,8875 4,8170 329

PROBINTZ 1,00 BIZKAIA 23,7283 3,9865 92

PROBINTZ 2,00 NAFARROA 23,3247 5,1795 77

PROBINTZ 3,00 ARABA 26,2386 4,8257 88

PROBINTZ 4,00 GIPUZKOA 21,8194 4,2437 72

Total Cases = 335

Missing Cases = 6 or 1,8 Pct

7.5 bertsiokoak:

SPSSWIN 7.5

Medias

247Batezbestekoen konparaketa

Resumen del procesamiento de los casos

Casos

Incluidos Excluidos Total

N N NPorcentaje Porcentaje Porcentaje

MATEMATI*PROBINTZMATEMATI* SEXUA

329

306

98,2 %

91,3 %

6

29

1,8 %

8,7 %

335

335

100 %

100 %

Page 260: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitzen itxura zertxobait ezberdina da, halere, noski, emaitzak berberak dira.

Azter ditzagun baliorik garrantzitsuenak.

Has gaitezen galdutako datuetatik. Sexuaren kasuan 306 subjekturekin lan egiten dugu eta 29 kasuezezagun ditugu; probintziaren kasuan, aldiz datu hau 6 aldiz bakarrik da ezezaguna. 6.1.3. bertsioan,datu ezezagunak batezbestekoen emaitzen ondoren azaltzen zaizkigu, 7.5. bertsioan, berriz, lanerakoerabiliko ditugun datu-kopuruen artean dago hasierako taulan, Resumen del procesamiento de casosizenburupean. Arazorik ez.

Batezbestekoak, desbideratze tipikoak eta talde bakoitzaren neurriak aztertuko ditugu jarraian, horibaita gehien interesatzen zaiguna.

Lehenik, sexuari dagozkion emaitzak aztertuko ditugu. GIZONENTZAKO: batezbestekoa (MEAN--MEDIA) 23.95 da eta bere desbideratze tipikoa (STD DEV. - DESV. TIP.) 5.02 da 122 gizonen datuekin(N=cases). EMAKUMEAK 184 dira, hauen batezbestekoa (MEAN-MEDIA) 23.96 eta desbideratze tipikoa(STD DEV - DESV. TIP) 4.50 dira, eta 184 emakumeren datuak (N=cases) dauzkagu. 6.1.3. bertsioarenkasuan gainaldean eta 7.5. bertsioan azpialdean, 306 ikasleren batezbestekoa eta desbideratze tipiko oro-korra azaltzen zaizkigu: 23.96 eta 4.71, hurrenez hurren.

Beste kasuan, emaitzak probintzien arabera konparatzen baditugu, emaitza onenak arabarrek lortzendituztela ikusiko dugu: 26.24; eta okerrenak gipuzkoarrok ditugu: 21.81. Emaitza hauen interpretazioanere arazorik ez dagoenez, benetan interesatzen zaigunari ekingo diogu: bi populazio edo talderen bi laginadierazgarriren batezbestekoen konparaketa eta deskribapena, alegia.

8.2. 2 LAGINEN BATEZBESTEKOEN KONPARAKETA ETA DESKRIBAPENA

Bigarren atal honetan, aurrekoan ez bezala, ez gara taldeak deskribatzera mugatuko; pauso bat gehiagoemango dugu. Gure ikasleen lagina, adibidez, adin horretako Euskal Herriko ikasleen populazio guztia-ren adierazgarria dela suposatuko dugu. Eta gure emaitzak populazio honetara orokortzeko asmoa dugu.

Matematika, fisika, edo beste gaietako frogak mutilentzat eta neskentzat ezberdinak diren planteagenezake. Aurreko atalean mutilen Matematikako noten batezbestekoa 23.95 dela ikusi dugu, neskena23.96 den bitartean. Hemendik ondoriozta al dezakegu, orokorrean, nesken emaitzak mutilenak bainohobeak direnik? Edo lortu dugun desberdintasun hau zorizkoa da eta ez dago matematikako emaitzetannesken eta mutilen artean desberdintasunik...

248

MATEMATI *PROBINTZ

MATEMATI

BIZKAIA MediaNDesv. tp.

23,7392

3,99

NAFARROA MediaNDesv. tp.

23,3277

5,18

ARABA MediaNDesv. tp.

26,2488

4,83

GIPUZKOA MediaNDesv. tp.

21,8272

4,24

Total MediaNDesv. tp.

23,893294,82

MATEMATI *SEXUA

MATEMATI

GIZONA MediaNDesv. tp.

23,951225,02

EMAKUMEA MediaNDesv. tp.

23,971844,50

Total MediaNDesv. tp.

23,963064,71

Page 261: Estatistika teoria eta praktika SPSSWIN erabiliz

Aurreko galdera planteatzen dugun modu berean, beste batzuk ere plantea genitzake: Ba al dago dife-rentziarik kurtsoren bat errepikatu duten eta errepikatu ez duten ikasleen adimen-testen emaitzen artean?A eredukoek eta B eredukoek emaitza ezberdinak lortzen al dituzte? eta B eta D-koek? eta A eta D-koek?Edozein tratamenduren aurreko eta ondoreneko emaitzak ere konpara ditzakegu. Edo bi tratamenduezberdinen ondorengo emaitzak, edo...

Eta aurreko kasu guztietan, bi taldeen batezbestekoen diferentziari zenbaterainoko balioa eman die-zaiokegu?

Kasu hauetan guztietan planteamendua bera da: emaitzak konparatu nahi ditugun 2 talde edo neur-keta (normalki tratamendu baten aurretik eta ondoren) ditugu.

Konparaketarekin hasi aurretik bi gauza izan behar ditugu oso kontuan:

1. Lagin edota neurketen askatasuna edo gabezia, eta

2. konparatu nahi ditugun emaitzen aldagaien banaketaren normaltasuna.

Bi baldintza hauen gurutzaketa, laginen askatasun edo gabezia eta banaketaren normalitatea edo eza,ondorengo taulak ematen digu. Hurrengo orrialdeetan garatuko ditugun lau aukerak aurkezten dizkigubertan:

2 talde ASKEAK 2 Talde erlazionatuak

PARAMETRIKOAK

(banaketa normalari T-test (lagin askeak) T-test (lagin erlazionatuak)

jarraitzen zaio)

EZ PARAMETRIKOAK MANNen U WILCOXONen W

(EZ ZAIO banaketa normalari jarraitzen)

Parametrikoak ala ez-parametrikoak?

Froga parametrikoak hautatuko ditugu, kasu honetan Student-en T, honako puntuak egiaztatzen direnean:

.- Aldagaiek tarte-eskalan neurtuak beharko dute.

.- Lagina zorizko prozeduren bitartez lortua izango da.

.- Aldagaiaren populazio-banaketei dagozkien laginek normalak izan beharko dute.

Konparatu nahi dugun emaitzaren aldagaia kurba normalaren arabera banatzen ez bada edo aurre-ko baldintzetako bat betetzen ez badu, froga ez-parametrikoak aplikatuko ditugu: MANNen U edotaWILCOXONen W.

Gogora ezazu, gure datuak kurba normalari atxikiak dauden ala ez ikusteko jarraitu beharreko pro-zesua aurreko gaian ikusi dugun K-S testa dela.

ASKEAK EDO ERLAZIONATUAK: ikus ditzagun biak.

1.- ASKEAK: Bi talde ezberdinen datuak ditut. Noizbait errepikatu duten ikasleen matematikako emaitzak,inoiz errepikatu ez duten ikasleen matematikako emaitzekin konparatu nahi ditut.

2.- ERLAZIONATUAK: Ikasteko ohituren emaitzak konparatu nahi ditut ikastaroa (tratamendua) eginaurretik eta ikastaroa (tratamendua) egin ondoren.

Aurreko adibidea batezbesteko binatuen adibiderik ohizkoena da. Tratamenduaren aurretik eta ondo-ren subjektu berberak neurtzen dira. Aldiz, ez da kasu bakarra.

249Batezbestekoen konparaketa

Page 262: Estatistika teoria eta praktika SPSSWIN erabiliz

Zenbaitetan, froga bera bi aldiz egitea ezinezkoa denez, ezingo ditugu AURREKO emaitzak ONDO-RENGO emaitzekin konparatu. Kasu hauetan beste modu batera lan egiten da, LAGIN PAREKATUAK ize-nekoarekin. Banako pare “berdin-berdinak” hautatu (lagineko subjektu guztiak binatzen ditugu). Bikoteakegin ondoren, zoriz, osatu nahi ditugun bi taldeei bikoteko elementuak egokitzen zaizkie. Eta elementubakoitzeko emaitzak “bere bikotekoaren” emaitzekin konparatzen dira.

Bi azterketa- edo analisi-mota hauen arteko oinarrizko bereizketa hau da: lagin erlazionatuetan, bana-ko bakoitzak “bere bikotearekin” binatua egon behar du, izan daiteke beste momentu batean neurtutakobanako bera, edo bere elementu bikia. Lagin askeen kasuetan laginak, printzipioz, ezberdinak dira.

8.2.1. Lagin edo neurri askeak. Student-en T

Lehen aipatu bezala, laginak askeak direla dakigunean, Student-en T-aren (froga parametrikoa) edo dago-kion froga ez-parametrikoaren arteko aukera egin behar dugu. Ohizkoena, gai honetan aurkeztuko dugunMann-en U da.

T-testa: Student-en T-a

Agian, estatistika-frogarik ezagun eta erabilienetakoa da.

Froga honekin lan egin ahal izateko, bi taldeetarako diseinu bera erabiltzen ariko gara. Funtsezko hel-burua bi taldeetako batezbestekoen berdintasun edo ezberdintasuna aztertzea da; horrez gain, azpipro-grama honen bitartez, bariantzen berdintasun edo ezberdintasuna aztertzerik izango dugu.

Studenten T frogaren kasuan, laginak konparatzen ditugun bi populazioen diferentzia 0 denaren hipo-tesi nulua ezartzen da.

Batezbesteko ezberdinak lortzea aurreikus daitekeen bi datu-multzo edukiko ditugu. Lagineko batez-bestekoetan lortu ditugun ezberdintasunak zenbateraino izan daitezkeen zoriaren ondoriagatik edo lagi-na batezbesteko ezberdinen populaziotatik eratorria izateko ondorioagatik jakitea da kontua.

Erabaki hau hartzeko T estatistikoarekin lan egiten da, hiru alderdi kontuan hartuz:

1.- Batezbestekoen diferentzia bera. Diferentzia zenbat eta handiagoa izan, zoriaren ondorio izateko pro-babilitatea txikiagoa izango da.

2.- Lagin bakoitzeko subjektu-kopurua. Subjektu-kopurua zenbat eta handiagoa izan, zoriak eragingutxiago izango du, eta beraz zailagoa izango da diferentzia zoriaren ondorio dela egiaztatzea.

3.- Desbideratze tipikoa. Datuak oso sakabanatuak badaude (bariantza handia), datuak elkarrengandikhurbil (bariantza txikia) daudenean baino errezagoa izango da diferentziak sortzea.

Hiru balio hauek dira T estatistikoa kalkulatzeko erabiltzen direnak, honek lagunduko digularik ezber-dintasunen adierazgarritasuna lortzen.

KONTUZ! Azpimarratu behar da, konparatu nahi ditugun populazioek bariantza berdinak edo ezber-dinak izatearen arabera, bi formula ezberdinekin lan egiten dela. Horregatik, SPSSWINen emaitzak inter-pretatzen ditugunean, lehenbizi bariantzak berdinak edo ezberdinak diren erabaki beharko dugu, etahorren arabera beheko formuletatik egokiena hautatuko dut, era berean EQUAL (bariantza berdinak) edoUNEQUAL (bariantza ezberdinak) ilaran begiratzea eskatuko didalarik.

250

Page 263: Estatistika teoria eta praktika SPSSWIN erabiliz

Formulak honakoak dira:

1. BARIANTZA BERDINEN kasurako:

non

2. BARIANTZA EZBERDINEN kasurako:

Emaitzak lortzeko prozesua

Demagun matematikako frogaren (MATEMATI) emaitzak konparatu nahi ditugula, kurtsoa ERREPIKATUDUTEN eta ERREPIKATU EZ DUTEN ikasleen artean (ERREPKUR).

Bi aldagai ditugu: koantitatibo edo zenbakizko bat, kontrastatzera goazen aldagaia (MATEMATI), etadikotomiko bat, aldagai taldekatua (ERREPKUR).

LIBURU.SAV fitxategia kargatu, eta kontrastatzera goazen (MATEMATI) eta taldeak egiten lagundukodidan (ERREPKUR) bi aldagaiak ezagutu ondoren, analisi honi dagozkion emaitzak lortzeko eman beha-rreko pausoak hauek dira:

EstadísticosComparar medias

Prueba T para muestras independientes...

Eta honen antzeko leiho bat irekiko zaigu, bertan kontrastatzeko aldagai bezala: MATEMATI hautatudugularik eta taldeak egiteko erabiliko dudan aldagai bezala berriz, ERREPKUR hautatu dudalarik. Hauda, MATEMATI aldagaiaren emaitzak ERREPKUR aldagaiak sortzen dizkidan bi taldeetan konparatu nahiditut.

t = X - X

Sn

+ Sn

1 2

12

1

22

2

t2 1 1

22 2

2

1 2S =

( n - 1)S +( n - 1)S

n + n -1

t = X - X

Sn

+ Sn

1 2

t2

1

t2

2

251Batezbestekoen konparaketa

Page 264: Estatistika teoria eta praktika SPSSWIN erabiliz

Aurrera jarraitu aurretik koadroa osatu behar dut, taldeak definituz; hau egin ezean, ERREPKUR-enatzean bi galdera ikur azalduko baitzaizkit. Horretarako, Definir grupos... botoia sakatuko dut eta goikokoadroa azalduko zait. Grupo 1 horretan ERREPKUR-ek lehenengo taldean hartzen duen balioa adiera-ziko dut: 1, eta Grupo 2 horretan berriz, talde horretan hartzen duen balioa: 2. CONTINUAR

Lagin askeentzako T frogako leihora itzuli, eta OPCIONES (aukerak) aldatzeko aukera dugu.Printzipioz, defektuz azaltzen direnak dira, nire iritziz, erabilienak, eta gehienetan egokienak. Ohizkokonfiantza-tartea % 95 da (ikus aurreko gaia) eta lan egiten ari garen bi aldagaietan daturik gabeko sub-jektuak bakarrik utziko ditugu analisitik kanpo. Aukera hauek aldatzeko, betiko prozesua segitu beharkoduzu. Arazorik ez.

Aukeren leihoa ireki baduzu, bukatzeko Continuar sakatu ezazu, eta sakatu Aceptar analisi hau egindiezazun.

Lortutako emaitzak, bertsio bakoitzerako, hauek dira:

SPSSWIN 6.1.3

t-tests for Independent Samples of ERREPKUR KURTSOREN BAT INOIZ ERREPIKATU DUZU?

Number

Variable of Cases Mean SD SE of Mean

MATEMATI

INOIZ EZ 278 24,1295 4,711 ,283

BAI 50 22,5800 5,265 ,745

Mean Difference = 1,5495

Levene’s Test for Equality of Variances: F= 1,363 P= ,244

t-test for Equality of Means 95%

Variances t-value df 2-Tail Sig SE of Diff CI for Diff

Equal 2,10 326 ,036 ,737 (,099; 3,000)

Unequal 1,95 63,89 ,056 ,796 (-,041; 3,140)

252

Page 265: Estatistika teoria eta praktika SPSSWIN erabiliz

SPSSWIN 7.5

Prueba T

Interpretazioa

Inoiz errepikatu ez duten 278 ikasleen batezbestekoa 24.1295 (24.13) dela ikus dezakegu, errepikatudutenena 22.58 dela ikusten dugun bitartean. Ezberdintasun honetatik abiatuz emaitza hauek ikasle guz-tiengana orokortu al ditzakegu eta errepikatu duten ikasleek errepikatu ez dutenek baino emaitza okerra-goak lortzen dituztela esan? Edota emaitza hauek zoriz lortu ditugu eta ezberdinak direla esateko bezainhandiak ez dira, eta ondorioz bi taldeek batezbesteko berbera dutela egiaztatzen duen hipotesi nuluaonartzen dugu?

Izango dudan errore-maila % 5 da (= .05).

Bariantzak ezberdinak edo berdinak izan, Studenten T analisia beti desberdina denez, emaitzak azter-tzeko garaian bi pauso eman behar ditugu:

Lehenengoa bariantzen berdintasuna aztertzean da, eta bestea, ondoren, batezbestekoen konparake-ta egitea.

Gure kasuan bi taldeen desbideratze tipikoek (bariantzaren erro karratua) balio hauek dituzte: 4.71(errepikatu ez dutenek, INOIZ EZ) eta 5.26 (errepikatu dutenek, BAI).

Bariantzen berdintasun-testa Leveneren Testak egina da. Hau 6.1.3. bertsioan emaitzen erdialdeanazaltzen da eta 7.5. bertsioan, berriz, taularen ezkerraldean. Gure kasuan F-ak (hurrengo gaian ikusikodugun bariantzaren analisiarekin bat datorrenak) balio bat hartzen du (F: 1.363) eta balio hau, bariantzakberdinak izanik, zoriz lortzeko probabilitatea .244 dela adierazten digu.

Emaitza hau interpretatzeko, zoriz lortzeko probabilitatea handia dela (100etik 24tan) esango dut, etabariantzen berdintasun-hipotesia beraz, oso onargarria dela. (Bariantzak ezberdinak direla esateko muga-rik ohizkoena, P edo SIGen balioa. 05 baino txikiagokoa denean dago; beste batzuetan, gutxitan, .01 damuga).

253Batezbestekoen konparaketa

Estadísticos del grupo

KURTSORENBAT INOIZERREPIKATU

MATEMATI INOIZ EZBAI

N MediaDesviación

típ.

Error típ.de lamedia

27850

24,1322,58

4,715,26

,28,74

Prueba de muestras independientes

MATEMATI Se hanasumidovarianzasigualesNo se hanasumidovarianzasiguales

1,363

Prueba de Levenepara la igualdad de

varianzasPrueba T para la igualdad de medias

Intervalo deconfianza

para la mediaInferior Superior

Error típ.de la

diferencia

Diferenciade

mediasSig.

(bilateral)gltSig.F

,244 2,102

1,946

326

63,894

,036

,056

1,55

1,55

,74

,80

9,95E-02

-4,15E-02

3,00

3,14

Page 266: Estatistika teoria eta praktika SPSSWIN erabiliz

Batezbestekoen konparaketa egiteko, beraz, bariantza berdinei dagozkien formulekin, hau da Equalenilaran azaltzen direnekin, lan egin behar dudala onartuko dut. (Pakete estatistikoak “ez daki” ikertzaileakhartuko duen erabakia zein den eta horregatik, beti bi kasuetarako emaitzak aurkezten dizkigu: Bariantzaberdinak (EQUAL- se han asumido varianzas iguales) edo desberdinak (UNEQUAL- no se han asumidovarianzas iguales). Kasu bakoitzean guk geuk hartu beharko dugu erabakia. Kasu honetan EQUALekoakerabiliko ditugu.

Behin erabaki hau hartu ondoren, batezbestekoen arteko ezberdintasuna zoriz lortzeko dagoen pro-babilitatea zenbatekoa den aztertzera pasako gara. (Mean Difference- Diferencia de medias): 1.5495(1.55).

Kalkuluen prozesua eta emaitzen aurkezpenaren ordena, honakoa da: t: 2.10 estatistikoa lortuko dut,ondoren, askatasun-graduak kontuan izanik (df): 326, “t” balioa zoriz lortzeko probabilitatea jakin ahalizateko, batezbestekoen berdintasunaren hipotesi nuluaren kasuan: (2- Tail Sig. o Sig. bilateral): .036

326ko askatasun-graduak modu honetan lortzen dira. Talde bakoitzean datu-kopuru bat daukagu, kasuhonetan 278 eta 50. Talde bakoitzeko azken datua aurreko datuetatik abiatuz lor genezake. Horrela, 278datu baditugu, askeak 277 dira, bestea gainerantzekoen batezbestekoa eta datuak jakinik lor dezakegu.Beste taldean, 49ren batezbesteko eta balioak baldin badakizkit, 50. elementuaren balioa ere lortu ahalizango dut. Hemen beraz: df =gl= 277 + 49 = 326

Prozesu hau bera erabiliko dugu bariantzaren analisian askatasun-graduak kalkulatzeko.

Ondoren, konfiantza-tartea kalkulatzeko errore estandarra aurkezten digu, (.74), eta azkenik kofiantzatartea, % 95ean kalkulatzen digu, (aldatu ez dugun) aukeretan defektuz dagoen konfiantza-maila baita.Horrela bada, errepikatu duten eta ez duten ikasleen emaitzen diferentziaren balioa, kasuen % 95ean,kopuru hauen artean kokatuko dela adierazten digu: 0,099 eta 3.000 edo berdina den (9.95 E-2, 3,000)tartean.

Ondorioa: batezbestekoen arteko diferentzia zoriz lortzeko daukagun probabilitatea (.036) lan egite-ko ezarritako muga (0.05) baino txikiagoa denez, desberdinak direla erabakiko dugu eta diferentziakNAHIKOA HANDIAK DIRELA ondoriztatuko dut. Emaitza hauen arabera, beraz, BI TALDEETAKO EMAI-TZAK EZBERDINAK DIRA eta hipotesi nulua BAZTERTZEA ERABAKIKO DUT.

Erabaki hau hartuz errore-tartea, edo errore bat egiteko probabilitatea, 0,036koa da.

Hau da, kasuen % 3.6 an diferentzia hauek zoriz lor litezke bi taldeen emaitzak berdinak direnean,eta kasu honetan, nik batezbestekoak ezberdinak direla erabaki dudanez, oker edo deskuidatuta egongonaiz.

Erabaki hau hartzeko ziurtasun handiagoa beharko banu (gehienez ere % 1eko errore-tartea onartukobanu, adibidez), aurkako erabakia hartuko nuke, batezbestekoak ezberdinak direla erabakitzeko ebiden-tzia nahikoa ez dudalako.

8.2.2. Neurri errepikatu edo erlazionatuak

Pentsa dezagun pertsona berberen, aldagai beraren bi uneren, edo anaien artean hartutako neurketen,edo elkarren artean antzeko ezaugarriak dituzten bikoteen bi neurketa-talderi buruz hitz egiten ari gare-la eta bikotearen elementuetako bat A formarekin tratatu dela, bestea B formarekin tratatu den bitartean.

Kasu hauetan jarraitu beharreko prozedura aurrekoarekiko zertxobait ezberdina da. Hemen ez dugu1. taldearen batezbestekoa 2. taldearen batezbestekoarekin konparatuko, bikote-lagun bakoitzarentzatemaitzen D diferentzia kalkulatu baizik, eta diferentzia hauen batezbestekoa 0 izatearen hipotesi nuluaplanteatuko dugu.

Ikus dezagun adibide praktiko bat. Demagun kurtso-hasieran lortutako emaitzak (NEURKET1), kurtso--bukaerako emaitzekin (NEURKET2) konparatu nahi ditugula. Datuak hauek dira:

254

Page 267: Estatistika teoria eta praktika SPSSWIN erabiliz

neurket1 neurket2 Diferentzia:D

8 10 -2

6 12 -6

8 14 -6

2 0 2

10 15 -5

7 9 -2

8 10 -2

10 11 -1

12 13 -1

10 11 -1

––––

-24

Diferentzien batura -24 da, beraz batezbestekoa -2.4 da. Irakurleak desberdintasunen bariantza kal-kula dezake (5.84) eta hemendik desbideratze tipikoa (2.41). SPSSWINek kuasibariantzarekin lan egitendu eta hau lortzeko bariantza bider elementu-kopurua (10) egingo da eta emaitza zati elementu-kopuruaken 1 (9) egingo dugu. Kuasibariantzaren emaitza 6.488 izango da, eta hemendik Std. Dev balioa lortu-ko dugu. Std. Dev = 2.5473.

Kalkuluak eskuz egiten badituzu, ez dira SPSSWINekoekin bat etorriko gauzatxo batean: eskuz lortu-tako desbideratze tipikoa 2.41 da eta SPSSWINek lortu duena 2.5473.

Hemendik diferentzien batezbestekoen errore tipikoa kalkulatzera bazoaz, eta kalkuluak eskuz eginbadituzu desbideratze tipikoa zati (n-1)en erro karratua egin beharko duzu; SPSSWINek, ostera, zati n-renerro karratua egin du. Azkenean, noski, bi kasuetan emaitza bera izango da. Ondoko formulan, eskuz lor-tutako desbideratze tipikoari Sd deitu diot, eta programa-paketeak lorturikoari STD. DEV. Hau esanda ikusditzagun formulak:

Gure kasuan

2.40Hemendik t estatistikoa lortzen dut. t = –––– = 2.98

.8055

Eta honen esanahia begiratuko dut tauletan.

(p = 0.015).

Ikus dezagun SPSSWIN paketeak nola aurkezten dizkigun emaitza hauek.

Oso adibide erraza jarri dut, fitxategi batean datuak tekleatuz aldagai hauek defini ahal izan ditzazun.Izen hauek erabili ditzakezu: neurket1 eta neurket2. Ondoren, hemen emandako datuak teklea itzazu.Beste aukera bat ere baduzu, hitzaurrean aipatutako Web orrialdeko TTESTPAR.SAV kargatzea, hainzuzen. Gero emaitza hauek lortzeko aginduekin hasi zaitez:

EstadísticosComparar medias

Prueba T para datos apareados...

EE =Sd

n -1=

2.41

9= 0.80 =

Std.Dev.

n=

2.5473

10= 0.8055

EE =Sd

n - 1=

Std.Dev.

n

255Batezbestekoen konparaketa

Page 268: Estatistika teoria eta praktika SPSSWIN erabiliz

eta honen antzeko pantaila bat lortuko duzu. Ezkerraldeko taldearen bi aldagaiak hautatu ditugu konpa-raketak egiteko, eta aktibatu egin ditugu, eskuinaldeko taldera pasatuz. Aukera guztiak zeuden bezala utziditut. Aceptar.

Lortu ditugun emaitzak ondorengoak dira:

SPSSWIN 6.1.3

t-tests for Paired Samples

Number of 2-tail

Variable pairs Corr Sig Mean SD SE of Mean

NEURKET1 8,1000 2,767 ,875

10 ,800 ,005

NEURKET2 10,5000 4,143 1,310

Paired Differences

Mean SD SE of Mean t-value df 2-tail Sig

-2,4000 2,547 ,806 -2,98 9 ,015

95% CI (-4,222; -,578)

7.5 bertsioan:

SPSSWIN 7.5

Prueba T

256

Estadísticos de muestras relacionadas

Media N Desviacióntíp.

Error típ.de lamedia

Par1

NEURKET1NEURKET2

8,10010,500

1010

2,76664,1433

,87501,310

Page 269: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitza hauen interpretazioak ez du inolako arazorik. Lehenik neurketa bakoitzaren deskribapena egi-ten digu. Lehenengo neurketaren batezbestekoa 8.10 da, bigarrengoarena 10.5, eta bi taldeen desbidera-tze tipikoak ere aurkezten dizkigu.

7.5. bertsioaren kasuan erdialdean eta 6.1.3. bertsioaren ezkerraldean, 10 puntuazio-bikote dauzka-gu, eta bi puntuazioen arteko korrelazio-koefizientea 0.800 dela adierazten digu. Hau da, korrelazio--koefiziente honekin bi puntuazioak gora eta behera modu nahiko uniformean dabiltzala eta hurrengobalioarekin Sig.=0.005, zoriz lortzeko probabilitatea 1.000tik 5 izango dela esaten dit.

Bi batezbestekoen konparaketen emaitzak, egia esan, beheko blokean aurkezten dizkigu; lehenik,batezbestekoen diferentzia (-2.40) eta gero desbideratze tipikoa (2.547) eta errore estandarra: (.806).Froga dezakezu gero konfiantza-tartea kalkulatzeko erabiliko duen estatistikoa, errore estandarra, desbi-deratze tipikoa zati subjektu-kopuruaren (kasu hontan 10) erro karratua eginez lortzen duela. (Frogaezazu emaitza hauek eskuz lortutakoen berdintsuak direla).

Gure kasuan konfiantza-tartea %95ekoa: (-4.2222,-0.5778) da.

Diferentzia hau zoriz lortzeko probabilitatea kalkulatzeko, lehenik Studenten T balioa kalkula ezazu(2.98), gero, emaitza hau zoriz lortzeko probabilitatea aurkezteko: 0.015.

Bi neurketen arteko diferentzia handi hau zoriaren ondorioz 1.000tik 15 alditan bakarrik izango delaadierazten dit honek. Edo neurketa bakoitzaren batezbestekoak ezberdinak direla erabakitzen badut1.000tik 15etan oker ibiliko naizela. Nahasteko arriskua handia al da? Txikia? Ikertzaileak erabaki behar-ko du. Estatistikak diferentzia -2.40koa dela esaten dit, konfiantza-tartea, berriz, lehen adierazi duguna,...eta gainerantzekoa aztertzeko psikologoak, pedagogoak, soziologoak... hartu beharko du parte.

Bi atalen integrazioa

2. adibidea. Adibide orokorra

Analisi honen funtsa ikusi ondoren adibide bat aurkezten dut, bertan, ikasteko ohiturak hobetzeko meto-do (tratamendu) birekin lortzen diren etekinak konparatzen saiatuko garelarik.

Egoera hauxe da. Ikasteko ohiturak hobetzeko ohizko metodo bat badago (BETIKOA), baina guk bestemetodo berri baten (BERRIA izenekoa) baliagarritasuna frogatu nahi dugu, eta aldi berean, berarekin lortuditugun emaitzak betikoarekin lortutakoekin konparatu nahi ditugu.

Horretarako, honakoa egin dugu: lau ikastetxetara joan gara eta ikastetxe bakoitzeko ikasleak, zoriz,bi taldetan banatu ditugu. Azkenean bi talde egin ditugu bakoitza ikastetxe bakoitzeko ikasleen erdiare-kin osatuz.

257Batezbestekoen konparaketa

Correlaciones de muestras relacionadas

CorrelaciónN

Par1

NEURKET1yNEURKET2

10

Sig.

,800 ,005

Prueba de muestras relacionadas

Intervalo de confianzapara la media

Inferior Superior

Error típ.de la

diferencia

Desviacióntíp.

Sig.(bilateral)gltMedia

Diferencias relacionadas

Par1

NEURKET1–NEURKET2

–2,4000 2,5473 ,8055 –4,2222 –5,778 –2,979 9 ,015

Page 270: Estatistika teoria eta praktika SPSSWIN erabiliz

Gure ikastaroen (tratamenduen) etekina konparatu eta ikusteko hiru azterketa edo analisi egin beharditugu:

1.- Ikastaroak hasi aurretik, ikasketa-ohiturei dagokionez, bi taldeek maila bera dutela frogatu.Horretarako, bi taldeen batezbestekoak konparatuko ditut, IKASTEKO OHITURAK: OHITURA1 alda-gaia, lehenengo neurketako emaitzetan. Lagin askeentzako Studenten T froga erabiliko dut.

2.- Ikastaroak baliagarriak direla frogatu. Horretarako, ikasteko ohituren hobekuntza 0 baino handiagoadenaren hipotesia frogatuko dut. Ikastaroaren ondoreneko ikasteko ohituren neurketaren emaitzak(OHITURA2) ikastaro aurreko neurketaren emaitzekin (OHITURA1) konparatuko ditut. Datu bina-tuentzako Studenten T froga erabiliko dut.

3.- Bi metodoen artean emaitzik onena zeinek eskaintzen duen frogatu. Horretarako, hobekuntza alda-gaia ikastaroaren aurreko eta ondorengoaren arteko diferentzia bezala definituko dut: HOBEKUNTZA= OHITURA2 - OHITURA1, eta aldagai honen emaitzak bi taldetan konparatuko ditut. Aldagai aske-entzako Student-en T froga erabiliko dut.

NEURRI ERREPIKATUEN diseinu bati buruz ari gara. Ikasteko ohituren emaitzak konparatu nahi dituttratamendu bakoitzaren AURRETIK eta ONDOREN.

1. TALDEA ... (OHITURA1) ... KURTSOA (BETIKOA) ... OHITURA2

2. TALDEA ... (OHITURA1) ... KURTSOA (BERRIA) ... OHITURA2

Froga estatistiko guztiak ikusiko ditugu. Lehenengoarekin hasiko gara.

Lehen pausoan ikastaroak hasi aurretik talde biek, ikasteko ohiturei dagokionez, maila bera dutela fro-gatu nahi dugu. Kasu hau gaiaren hasieran aztertu dugunaren oso antzekoa da: bi talde askeen batezbes-tekoen konparaketa. Talde bakoitzeko elementuak definitzeko (talde bakoitzari zein elementu dagokionjakiteko) TRATAMEN aldagaia erabiliko dut, eta OHITURA1 aldagaiaren emaitzak konparatuko ditut.

Horretarako, LIBURU.SAV fitxategia kargatu ondoren eman beharreko pausoak hauek dira:

EstadísticosComparar medias

Prueba T para muestras independientes...

Azaltzen zaigun leihoan, lehen aipatu bezala, egiaztatzeko aldagai gisa OHITURA1 aldagaia hauta-tuko dut, eta taldeak egiteko aldagai bezala TRATAMEN erabiliko dut.

258

Page 271: Estatistika teoria eta praktika SPSSWIN erabiliz

Jarraitu aurretik koadroa osatu behar dut, taldeak definituz. Hau egiten ez dudan bitartean,TRATAMEN-en atzetik, bi galdera-ikur azalduko zaizkit. Horretarako, Definir grupos... botoia sakatukodut eta behealdeko koadroa azalduko zait. Grupo 1en hutsunean TRATAMEN-ek lehenengo taldean har-tzen duen balioa adieraziko dut: 1, eta Grupo 2renean, talde horretan hartzen duen balioa: 2. CONTI-NUAR. Ez ditut “opciones” edo aukerak aldatuko, beraz, analisi hau egin dezan, Aceptar sakatuko dut.

Bertsio bakoitzarentzat lortutako EMAITZAK ondorengoak dira:

SPSSWIN 6.1.3.

t-tests for Independent Samples of TRATAMEN tratamen

Number

Variable of Cases Mean SD SE of Mean

OHITURA1

betikoa 47 40,0851 6,089 ,888

berria 72 38,5417 6,567 ,774

Mean Difference = 1,5434

Levene’s Test for Equality of Variances: F= ,025 P= ,875

t-test for Equality of Means 95%

Variances t-value df 2-Tail Sig SE of Diff CI for Diff

Equal 1,29 117 ,200 1,197 (-,827; 3,914)

Unequal 1,31 103,65 ,193 1,178 (-,793; 3,880)

7.5 bertsioan emaitzak hauek dira:

SPSSWIN 7.5.

Prueba T

259Batezbestekoen konparaketa

Estadísticos del grupo

tratamen

OHITURA1 betikoaberria

N MediaDesviación

típ.

Error típ.de lamedia

4772

40,085138,5417

6,08936,5670

,8882,7739

Prueba de muestras independientes

OHITURA1 Se hanasumidovarianzasigualesNo se hanasumidovarianzasiguales

,025

Prueba de Levenepara la igualdad de

varianzasPrueba T para la igualdad de medias

Intervalo deconfianza

para la mediaInferior Superior

Error típ.de la

diferencia

Diferenciade

mediasSig.

(bilateral)gltSig.F

,875 1,289

1,310

117

103,653

,200

,193

1,5434

1,5434

1,1971

1,1781

-,8273

-,7928

3,9141

3,8797

Page 272: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitzetan, lehenik, talde bakoitzaren deskribapena azaltzen zait. Ikus dezakegu lagin osoko 335 per-tsonen datuak izan beharrean, 119 pertsonenak bakarrik dauzkatela (47 talde batean eta 72 bestean). Biprogramen (tratamenduen) eraginkortasuna konparatzeko, 4 ikastetxerekin bakarrik ari gara lanean.Gainerantzeko subjektuei tratamenduari dagokion datua gehitu ez diegunez, SPSSWINak analisitik kanpoutziko dizkigu.

Aurrera.

Tratamenduen batezbestekoak honakoak dira: 40.08 gero ohizko kurtsoa jasoko duen taldearentzat(BETIKOA) eta 38.54 kurtso berria garatuko den taldearentzat (BERRIA).

Diferentzia (Mean difference - diferencia de medias = 1.5434) ez da txikia, baina kantitateak nahikoahandiak direnez, ikus dezagun ea zoriaren ondorio izan daitekeen eta ea bi taldeak, ikasketa-ohitureidagokionez, homogeneotzat har ditzakegun.

Ondoren 6.1.3. bertsioan Levene frogaren emaitzak topatzen ditugu, bariantzen berdintasunari edoberdintasunik ezari buruz erabakitzeko. 7.5. bertsioak beheko taulan, gainerantzeko balioen ondoan aur-kezten dizkigu.

Zer erabaki hartuko dugu?

Hartu beharreko lehen erabakia bariantzen berdintasunari edo berdintasunik ezari buruzkoa da (gogo-ratu Studenten T-rako bi formula ditugula, bariantzak berdinak diren edo ez direnaren arabera).

Erabaki hau hartzeko Leveneren Testaren F -an erreparatuko dut: 0.025. Oso txikia, eta balio hau zorizlortzeko probabilitatea, berriz, oso handia: 0.875. Hemendik ezinezkoa da bariantzak ezberdinak direlaerabakitzea. Nahasteko probabilitatea oso handia litzateke: 0.875. Noski!, talde bien desbideratze tipi-koak oso antzekoak dira (6.08 eta 6.56). Nire ondorioa, beraz, bariantzak berdinak direla izango da.

Horrela bada, (se han asumido varianzas iguales) EQUAL-eko ilaran azaltzen zaizkidan emaitzakaztertzen jarraituko dut. Eta hemen T-ren balioa 1.289 dela daukat, 117ko askatasun-graduarekin, (sub-jektu-kopurua ken talde-kopurua). 7.5. bertsioan batezbestekoen diferentzia (mean difference) (1.5434)eta diferentzien errore estandarra (1.19) agertzen zaizkigu.

Ondoren, batezbestekoen diferentziaren konfiantza-tartea % 95ean zein den adierazten dit: -0.82733.9141.

Tarte honek % 95eko konfiantza-mailarekin (% 5eko errore-tartearekin), batezbestekoen diferentziabalio horien artean kokatuko dela adierazten dit. Baina, diferentzia 0 izatea bazter al dezaket?

EZETZA begi-bistakoa da, bi arrazoi direla tarteko.

Lehenengo arrazoia: 0 balioa konfiantza-tarteko mugen barnean sartua dago % 95ean. Honek dife-rentziaren balio posibleetako bat dela esan nahi du. Horregatik, aukera bezala behintzat ez baztertzerabultzatzen nau.

Bigarren arrazoia: batezbestekoak ezberdinak direla erabakiz gero nahasteko probabilitatea 0.200 da.Hau da, diferentzia hau zoriz emateko probabilitatea bi taldeetako batezbestekoak berdinak diren kasuan,0.200 da. Probabilitate honek hipotesia baztertzeko oso altua dirudi.

Arrazoi hauetan oinarrituz, beraz, nire ondorioa izango da EZIN dudala esan batezbestekoak desber-dinak direnik. Batezbestekoak berdinak dira.

Bigarren froga. Datu parekatuak edo erlazionatuak

Tratamenduak, orokorrean, eraginkorrak diren ala ez planteatzen da hemen. Hau da, tratamenduarenezaugarriak alde batera utzita, ea orokorrean lau kurtsoetako ikasleak ikasketa-ohiturei dagokionez hobe-

260

Page 273: Estatistika teoria eta praktika SPSSWIN erabiliz

kuntzarik izan ote duten. Horretarako, ikasketa-ohiturei buruz egin ditugun bi neurketen emaitzak kon-paratuko ditugu. Kurtsoaren aurretik (OHITURA1) eta kurtsoaren ondoren (OHITURA2).

Analisi hau burutzeko, LIBURU.SAV fitxategia kargatu ondoren eman beharreko pausoak hauek dira:

EstadísticosComparar medias

Prueba T para muestras relacionadas...

Ondorengo leihoaren antzeko bat azalduko zaigu, eta bertan konparatu nahi ditugun emaitzen bialdagaiak hautatu ditugu. Kasu honetan, analisia egiteko pausoak hiru dira. Lehenik bi aldagaiak sakatzenditut, eta leihoaren behealdean kokatzen zaizkit variable1 eta variable2 izenpean. Gero, eskuinalderakonorabidean dagoen geziaren botoia sakatu eta biak eskuinaldera pasatzen dira Variables relacionadas-enazpira. Aceptar.

Emaitzak ondorengoak dira:

SPSSWIN 6.1.3

t-tests for Paired Samples

Number of 2-tail

Variable pairs Corr Sig Mean SD SE of Mean

OHITURA1 39,0940 6,365 ,588

117 ,762 ,000

OHITURA2 43,6923 5,320 ,492

Paired Differences

Mean SD SE of Mean t-value df 2-tail Sig

-4,5983 4,152 ,384 -11,98 116 ,000

95% CI (-5,359; -3,838)

261Batezbestekoen konparaketa

Page 274: Estatistika teoria eta praktika SPSSWIN erabiliz

7.5 bertsioan:

SPSSWIN 7.5

Prueba T

Berriro ere, bertsioen artean aldatzen den gauza bakarra aurkezpen-formatoa da, estatistikoak berbe-rak dira eta, noski, baita emaitzak ere.

Lehenik bi aldagaien deskribapena aurkezten digu (hobekuntza-programaren aurretik eta ondoren).Esan behar dugu kasu honetan ez dauzkagula bi talde, bi aldiz neurtutako 117 pertsona baizik, kurtsoa-ren aurretik eta ondoren; horregatik lagin-neurri bakar bat aurkezten digu: 117.

OHITURA1 aldagaiaren batezbestekoa (programaren aurretikoa) 39.0940 da, eta ondorenekoa, OHI-TURA2, 43.6923 da. Aldagaietako bakoitzaren desbideratze tipikoak 6.36 eta 5.31 dira, hurrenez hurren,errore estandarrak 0.58 eta 0.49 izanik. 6. gaian ikusten genuen bezala, errore estandar hauek dirakonfiantza-tarteen kalkulurako erabil ditzakegunak.

Lehenago 6.1.3 bertsioan eta hurrengo taulan 7.5 bertsioan, Pearsonen korrelazio-koefizientea (0.762)eta beronen adierazgarritasuna (.000) azaldu zaigu.

Zer egiten du hemen bi aldagaien arteko erlazioa aztertzeko balio duen korrelazio-koefizienteak?

Erantzuna erraza da: lehen eta bigarren puntuazioen artean dagoen erlazioa jakin nahi dugu. Gertadaiteke horrelako kurtso bat, hasierako puntuazioak baxuak dituztenentzat probetxugarri izatea eta aldiz,hasierako puntuazioak altuak dituztenentzat baliogabea izateaz gain, kaltegarria ere izatea. Bi aldagaienemaitzek zenbaterainoko erlazioa gordetzen duten aztertzeko aurkezten digu korrelazio-koefiziente hau.

Gure kasuan positiboa da, eta bi aldagaien artean oso erlazio garrantzitsua dagoela esango dugu.(Korrelazio-koefizientearen zenbatekoa gehiago zehaztuko dugu, erregresioaren gaian ikusiko dugun

262

Estadísticos de muestras relacionadas

Media N Desviacióntíp.

Error típ.de lamedia

Par1

OHITURA1OHITURA2

39,09443,692

117117

,5885,4918

6,36535,3199

Prueba de muestras relacionadas

Intervalo de confianzapara la media

Inferior Superior

Error típ.de la

diferencia

Desviacióntíp.

Sig.(bilateral 1)gltMedia

Diferencias relacionadas

Par1

OHITURA1–OHITURA2

–4,5983 4,1524 ,3839 –5,3586 –3,8379 –11,978 116 ,000

Page 275: Estatistika teoria eta praktika SPSSWIN erabiliz

determinazio-koefizientean oinarrituz). Emaitza hau zoriz lortzeko probabilitatearen balioa gehitzen diguhonek, hau da, aldagaien artean erlazioa badagoela erabakitzen badugu, nahasteko probabilitatea .000dela adierazten digu.

Eta beheko blokean berezko diferentzien emaitzak aurkezten dizkigu. Estatistiko hauen kalkulurako,banakako diferentziekin lan egiten du, hau da, subjektu bakoitzarentzat bigarren eta lehenengo puntua-zioen diferentzia kalkulatzen du: di, eta orain aldagai honen emaitzak aurkezten dizkigu.

Diferentzien batezbestekoa, (batezbestekoen diferentziekin bat datorrena), -4.5983 da, lehenengobatezbestekoa kantitate horretan bigarrengoa baino txikiagoa da.

KONTUZ! Azterketa hau eskatzeko garaian lehenbizi OHITURA2 aldagaia eta gero OHITURA1 ida-tzi baduzu, diferentziaren zeinua aldatu egingo zaizu. SPSSak beti lehenengo aldagaiaren emaitzak kenbigarrenarenak aurkeztuko dizkizu. Zuri dagokizu lehenengo eta bigarrengo aldagaia zein izango denerabakitzea.

Aurrera! Ondoren desbideratze tipikoaren eta errore estandarraren emaitzak eta diferentziarenkonfiantza-tartea % 95ean: (-5.359 -3.838) aurkezten dizkigu.

Diferentzien emaitzen deskribapenarekin amaitu dugu; gure kasuan, ikasketa-ohiturei buruzko kurtsoaeskaini ondoren lortutako hobekuntza aipa genezake.

Orain egin litekeen eta egin behar genukeen galdera hau da: zenbateraino izan liteke hobekuntza hauzoriaren ondorio?

Galdera hau erantzuteko T-ren balioa, askatasun-graduak (gogoratu subjektu-kopuruari 1 kenduta lor-tutako emaitzarekin bat datorrela), eta 2-tail Sig-en balioak aurkezten dizkigu. 2-tail Sig: .000.

Hobekuntza hau zoriaren ondorio izateko probabilitatea .000 dela adierazten digu.

Analisi estatistikoa hemen amaitzen da.

Emaitzen interpretazio estatistikoa hemen amaitzen da. Hobekuntza kurtsoagatik izan dela ondorioz-tatzea oso arrunta da. Baina hau OSO AKATS ARRUNTA da. EMAITZEK EZ DIDATE HAU ESATEN.Emaitzek diferentziak zoriz izateko probabilitatea ia baliogabea dela esaten didate, soilik. Diferentziahorien azalpena ikertzaileak eman behar du, eta horretarako planteatu duen ikerketaren diseinua osogogoan izan behar du. (Inongo tratamenturen beharrik gabe 8 urteko haurrek, datorren urtean batezbes-teko altuera handiagoa izango dutela badakigu. Zergatik? urtebete zaharragoak direlako..!!). Studenten Tfrogak ez du azalpenik ematen. Hau ikertzaileari dagokio. Hori bai, ikerketaren diseinua ongi egina bada-go, ondorio gehiago atera ahal izango ditugu, baina ez Studenten T frogaren emaitzen analisiak azaltzendizkidalako.

Hirugarren froga estatistikoa

Egiten ari garen hiru analisiak osatzeko, BETIKOA kurtsoa jarraitu duten subjektuen hobekuntza etakurtso BERRIA jarraitu dutenen hobekuntzak konparatzera joko dugu.

Konparaketa horretarako bide desberdinak dauzkat. Gai honetan bi pauso hauek jarraituz egingodugu:

1.- HOBEKUNT aldagaia sortuko dut, subjektuek ikasketa-ohiturei dagokienez izan duten hobekuntzabezala definituz. Hau da, bigarren emaitzen eta lehenengo emaitzen arteko diferentzia izango da.

Nik definituko dut: HOBEKUNT = OHITURA2 - OHITURA1

2.- Bi taldeen hobekuntza konparatuko dut. Hau da, BETIKOA kurtsoa jarraitu dutenen eta kurtso BERRIAjarraitu dutenen HOBEKUNT-aren emaitzak konparatuko ditut.

263Batezbestekoen konparaketa

Page 276: Estatistika teoria eta praktika SPSSWIN erabiliz

HOBEKUNT aldagaia lortzeko modua definitzera joko dut (nik, jadanik, LIBURU.SAV fitxategian sartudizudana).

Horretarako pausoak:

TransformarCalcular

Eta ondorengo leihoa lortzen dut, bertako goialdearen ezkerrean: Variable de destino-n aldagai berria-ren izena idatzi dut: HOBEKUNT, eta eskuinaldean, Expresión numérica-n, lortzeko moduaren formulaidatzi dut. Nahi baduzu, idazteko, behealdearen ezkerreko zerrendatik aldagaiak aukeratu eta eskuinal-dera pasatuz joan zaitezke, analisian eragina duten aldagaiak edota pantailan agertzen zaizkizun tekla-tuko sinboloak aukeratzen diren modu berean. Bestela, ordenadoreko teklatuarekin egin dezakezu.Aceptar.

Emaitza bezala, darabilzun datu-fitxategiaren bukaeran barnean hartuko dizun, aldagai berria sortukodizu.

Ohar bi

1.- Nik prestatutako fitxategiarekin ari bazara eta, esanekoa izanik adierazitako pauso guztiak eman badi-tuzu, Aceptar eragitean aldagaia aldatu nahi ote duzun galdetuko dizu, eta nahi duzuna erantzun(nahi baduzu, noski) azken emaitza berbera izango baita.

2.- Lan-saio hau amaitzean, aldagai-mota honen sorreraren emaitzak, datu-fixategian gorde nahi baditu-zu, gure kasuan LIBURU.SAV-en, lan-saioa amaitu aurretik gordetzeko ohitura hartu behar duzu, bes-tela SPSSWINetik ateratzen zarenean: GALDU EGINGO BAITIRA!!!! Abisatzen duenak...

Aurrera!

Orain jada, aldagai honekin, HOBEKUNT-ekin, lan egin dezakezu hasierako bat bailitzan.

Guk bi kurtsoen hobekuntzaren emaitzak konparatu nahi ditugu. Emaitza hauek lortzeko, aurrekokasuetan bezala, pausoak hauek dira:

EstadísticosComparar medias

Prueba T para muestras independientes...

264

Page 277: Estatistika teoria eta praktika SPSSWIN erabiliz

Agertzen zaigun leihoan, lehen aipatu bezala, egiaztatzeko aldagai gisa: HOBEKUNT hautatuko dut,eta taldeak egiteko erabiliko dudan aldagai bezala TRATAMEN.

Jarraitu aurretik koadroa osatu behar dut, taldeak definituz. Egiten ez dudan bitartean, TRATAMEN-enatzetik, galdera-ikur biak azalduko zaizkit. Horretarako, Definir grupos... botoia sakatu eta beheko koa-droa azalduko zait. Grupo 1en TRATAMEN-ek lehenengo taldean hartzen duen balioa adieraziko dut (1),eta Grupo 2n, talde horretan hartzen duen balioa (2). CONTINUAR. Aukerak ere ez ditut aldatuko, horre-gatik Aceptar sakatuko dut analisi hau egin diezadan.

Bertsioetako bakoitzean lortutako EMAITZAK honakoak dira:

EMAITZAK 6.1.3.

t-tests for Independent Samples of TRATAMEN tratamen

Number

Variable of Cases Mean SD SE of Mean

HOBEKUNT

betikoa 47 3,0638 4,250 ,620

berria 70 5,6286 3,777 ,451

Mean Difference = -2,5647

Levene's Test for Equality of Variances: F= ,104 P= ,747

t-test for Equality of Means 95%

Variances t-value df 2-Tail Sig SE of Diff CI for Diff

Equal -3,42 115 ,001 ,749 (-4,049; -1,081)

Unequal -3,34 90,72 ,001 ,767 (-4,088; -1,041)

7.5 bertsioan emaitzak hauek dira:

Prueba T

265Batezbestekoen konparaketa

Estadísticos del grupo

tratamen

HOBEKUNT betikoaberria

N MediaDesviación

típ.

Error típ.de lamedia

4770

3,0635,628

4,24983,7770

,6199,4514

Prueba de muestras independientes

HOBEKUNT Se hanasumidovarianzasigualesNo se hanasumidovarianzasiguales

,104

Prueba de Levenepara la igualdad de

varianzasPrueba T para la igualdad de medias

Intervalo deconfianza

para la mediaInferior Superior

Error típ.de la

diferencia

Diferenciade

mediasSig.

(bilateral)gltSig.F

,747 -3,423

-3,344

115

90,719

,001

,001

-2,5647

-2,5647

,7492

-,7669

-4,0488

-4,0881

-1,0807

-1,0414

Page 278: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitza hauek interpretatzeko, nahikoa eredu edo jarraibide baduzu, beraz modu eskematikoan adie-raziko dizut BETIKOA tratamenduarentzako hobekuntza 3.06koa izan dela, eta BERRIArentzakoa5.62koa. Desbideratze tipikoak 4.25 eta 3.77 dira, kurtso-mota bakoitza jarraitu duten 47 eta 70 pertso-nentzat.

Batezbestekoen diferentzia -2.56 koa da (bigarren taldekoen emaitzak hobeak izan dira).

Diferentzia hau zoriaren ondorio ote den aztertzen jarraitu aurretik, gero probabilitatea kalkulatzekobehar dudan emaitzen taldea baldintzatuko duan bariantzen berdintasuna aztertu behar dugu.

Levene testaren F-a .104 da, eta emaitza hau zoriz lortzeko probabilitatea 0.747koa da. Honek bi tal-deetako bariantzen arteko diferentziak zoriz emateko probabilitatea handia dela adierazten dit (.05 bainohandiagoa). Bariantzak berdinak direla onartuz amaituko dut, eta ondorioz analisiak “Se han asumidovarianzas iguales”-en ilaran interpretatzen segiko dut.

Hemen t = -3.42ko balio bat daukat, 115 graduko askatasunarekin (taldeetako bakoitzagatik gradu batkentzen dit: 117 -2), eta diferentzia hauek zoriz izateko probabilitatea: 2-tail SIG - bilateral= .001 da.

% 95erako hobekuntzen diferentziarako konfiantza-tartea hau da:

(-4.049, -1.081)

Diferentzia hauek zoriaren ondorio ez direla esanaz amaituko dut.

Baina lehen bezala, KONTUZ! Hemendik ezin da kurtso bat bestea baino hobea denik ondorioztatu,ez emaitza hauekin bakarrik behintzat. Froga honek emaitzak zoriz lortutakoak ez direla esaten dit soilik(edo izateko probabilitatea .000 dela). Orain jada, ondorio gehiago ateratzea ikertzailearen eta plantea-tutako ikerketaren diseinuaren kontua da. Zeren agian BETIKOA metodoa hobea da, baina beste meto-doko irakasleak hobeak dira, edo gogo handiagoa jarri dute,... Studenten T frogak, honetaz, ez daki ezer;ikertzaileak jakin BEHAR du.

8.2.3. Froga ez-parametrikoa. Datu askeak

Mann-en U: T frogarentzat betetzen ez badira

Demagun OHITURA1 aldagaiak ez duela sailkapen normala jarraitzen. Edo gure laginean oso subjektugutxi dauzkagula. Edo Studenten T frogarekin lan egiteko beharrezkoak diren baldintzetako bat ez delabetetzen. Honek MANNen U FROGA EZ-PARAMETRIKOAREKIN lan egitera bultzatuko gaitu.

Esan behar da ez-parametrikoen artean, T frogaren alternatibarik onena eta erabiliena dela.

Ikus ditzagun analisi honen emaitzak, hala nola hauen interpretazioak lortzera eramango gaituen pro-zesua.

Horretarako Studenten T-arekin eginiko analisietako baten ihardespena egingo dugu: OHITURA1 -enemaitzak konparatuko ditut, bi programa edo kurtsoak aplikatu ditudan bi taldeetan.

Oinarri teorikoak

Analisi hau egin ahal izateko gure aldagaia gutxienez eskala ordinal batean neurtu beharko dugu.

Kalkuluaren prozesua honakoa da.

Lehenik puntuazio guztiak txikitik handira ordenatuko ditugu. Ondoren talde bakoitzeko puntuazioenheinak edo ordenak batuko ditugu.

266

Page 279: Estatistika teoria eta praktika SPSSWIN erabiliz

U estatistikoa lortzea da helburua, lagin handietarako formula honek (Downie, 289) definitzen duela-rik:

U estatistikotik abiatuz, eta ondorengo aldaketaren bitartez, dagokion Z lortuko dugu; kurba normala-ri jarraitzen zaio eta emaitza zoriz lortzeko dagoen probabilitatea emango digu.

Irakurleak, emaitza hauek eskuz lortu eta, gero nik hemen aurkezten ditudanekin konparatu ditzake.

OHARRA: gure adibidera egokitzen den aurreko prozesuak, aldaketa txiki bat jasaten du lagina txikiadenean (20 subjektutik behera). Egoera hauetan taula egokiak erabili beharko ditugu; interesa duenakTrillas argitaletxeko, Sidney-Siegelen Estadística no paramétrica (1988) testuan topa ditzake.

WINDOWSentzako SPSSarekin emaitzak lortzeko...

EstadísticosPruebas no paramétricas

2 muestras independientes...

Eta ondorengo leihoaren antzeko bat lortuko dut. Contrastar-en, OHITURA1 hautatzen dut etaVariable de agrupación-en, TRATAMEN. Studenten T kasuan bezala, Definir grupos-era pasatzen naiz: 1eta 2 hautatu. Continuar. Froga-mota bezala Mann-Whitney-ren U-a hautatzen dut. Aukerak daudenbezala uzten ditut. Aceptar.

z = U - (N1* N2 / 2)

N1* N2(N1+ N2 +1)12

1

U = N N + N ( N + 1)

2- R1 2

1 1x∑

267Batezbestekoen konparaketa

Page 280: Estatistika teoria eta praktika SPSSWIN erabiliz

Lortutako emaitzak hauek dira:

SPSSWIN 6.1.3

- - - - - Mann-Whitney U - Wilcoxon Rank Sum W Test

OHITURA1

by TRATAMEN tratamen

Mean Rank Sum of Ranks Cases

64,76 3043,5 47 TRATAMEN = 1,00 ohizkoa

56,90 4096,5 72 TRATAMEN = 2,00 berria

—-

119 Total

U W Z 2-Tailed P

1468,5 4096,5 -1,2171 ,2235

7.5 bertsioan lortutakoak:

SPSSWIN 7.5

Pruebas no paramétricas Prueba de Mann-Whitney

Emaitzen interpretazioa sinplea da. BETIKOA taldean 47 subjektu dauzkagu, eta 72 BERRIAn; taldebakoitzaren puntuazioen ordenen batezbestekoa aurkeztu ondoren, (64.76 eta 56.90), batez beste“Betikoa” taldekoak “Berria” taldekoak baino 12 postu atzeago sailkatuak daudela ikusten dugu.

Orain betiko galdera planteatzen dugu: kurtso bien emaitzak berdinak izan arren, zenbateraino izandaitezke emaitza hauek zoriz lortuak?

Galdera hau erantzun aurretik, U (1468.50), W (4096.50), eta Z (-1.217) estatistikoen balioak aurkez-ten zaizkigu, lehen azaldu ditugun formulen arabera lortzen direnak. Ondoren Z estatistikoari lotzenzaion probabilitatearen balioa aurkezten zaigu, hipotesi nuluaren ustean, hau da N(0,1) sailkapena segi-tzen duenaren ustean.

Ez dugu W estatistikoaren esanahia adierazi: Wilcoxon-en frogari dagokio eta guk hurrengo ataleanaztertuko dugu.

268

Rangos

tratamen

OHITURA1 betikoaberriaTotal

NRango

promedio

4772

119

Suma derangos

64,7656,90

3043,54096,5

Estadísticos de contrastea

OHITURA1

U deMann-WhitnevW de WilcoxonZSig.asintót(bilateral)

1468,5004096,500

-1.217,224

a. Variable de agrupación: tratamen

Page 281: Estatistika teoria eta praktika SPSSWIN erabiliz

Gure kasuan, probabilitatea 0.224 da. Honek esan nahi du, diferentzia hauek zoriaren ondorio beza-la 100etik 22.4tan lortuko ditugula. Gogora dezagun Studenten T-aren kasuan probabilitate hau0.200ekoa zela. Hipotesi nulua ezin dugu baztertu. Beraz, Mannen U froga Studenten T baino kontser-badoreagoa dela ikus dezakegu. Hau orokorrean froga ez-parametrikoekin gertatzen da, hain zuzen ere,bere aplikaziorako exijentzia edo behar gutxiago ezartzen ditugulako.

8.2.4. Froga ez-parametrikoa. Datu parekatu edo erlazionatuak

Wilcoxon-en W: T-testa erabiltzeko baldintzak ez dira betetzen

Lagin askeen kasuan bezalaxe, Studenten T froga parametrikoa aplikatzeko beharrezkoa den baldintzeta-ko bat ez egiaztatzea gerta liteke (laginaren normalitatea...).

Kasu horretan, eta laginak binatuak edo erlazionatuak direnean, aukera Wilcoxonen testa aplikatzeada.

Froga hau aplikatzeko prozesua honakoa da. Diferentziak kalkulatuz hasten da, balio absolutuan txi-kitik handira ordenatzen jarraituz, hau da zeinua kenduta. Jarraian ordena berri bakoitzari diferentzianzuen zeinua ezartzen zaio.

Ezberdintasunik ez dagoen hipotesi nuluetan, jadanik diferentziaren zeinua ezarri diegunetan, heinenbatura zero dela suposatzen da. Edo berdina dena, zeinu positiboko heinak eta zeinu negatibokoakbatzen baditugu, batura biak aldi berekoak izan behar lukete. BATURA HAU DA kontrasteko estatistikoaosatuko duena.

Laginak txikiak liratekeen kasuan (N < 25), horretarako bereziki eraikitako taulekin lan egin beharkogenuke. Baina laginak handiagoak balira, parametroen kurba normalerako hurbilketa egingo genuke, bereparametroak hauek izanik:

Banaketa normal honen arabera lortuko dugu Z estatistikoaren adierazgarritasuna.

Adibidea

OHITURA1 eta OHITURA2 aldagaien emaitzak konparatzeko Studenten T frogaren ihardespen bat egin-go dugu.

WINDOWSerako SPSS-rekin emaitzak lortzeko...

EstadísticosPruebas no paramétricas

2 muestras relacionadas...

Eta ondorengo leihoaren antzeko bat lortuko dut, konparatu nahi ditudan bi aldagaiak jadanik barne-an ditudalarik: OHITURA1 eta OHITURA2. Froga-mota honetan, defektuzko aukera uzten dut markatua:Wilcoxon.

μ σ=N(N +1)

4=

N(N + 1)(2N + 1)

242

269Batezbestekoen konparaketa

Page 282: Estatistika teoria eta praktika SPSSWIN erabiliz

Lortzen ditugun emaitzak honakoak dira:

SPSSWIN 6.1.3

- - - - - Wilcoxon Matched-Pairs Signed-Ranks Test

OHITURA1

with OHITURA2

Mean Rank Sum of Ranks Cases

17,50 227,50 13 – Ranks (OHITURA2 LT OHITURA1)

60,08 5767,5 96 + Ranks (OHITURA2 GT OHITURA1)

8 0 Ties (OHITURA2 EQ OHITURA1)

—-

117 Total

Z =-8,3850 2-Tailed P = ,0000

7.5 bertsiorako:

SPSSWIN 7.5

Pruebas no paramétricas

Prueba de los rangos con signo de Wilcoxon

270

Rangos

OHITURA2–OHITURA1

RangosnegativosRangospositivosEmpatesTotal

NRango

promedioSuma derangos

13

968

117

17,50

60,08

227,50

5767,50

a

b

c

a. OHITURA2 < OHITURA1b. OHITURA2 > OHITURA1c. OHITURA1 = OHITURA2

Estadísticas decontraste

ZSig. asintót(bilateral)

-8.385,000

a

b

a. Basado en los rangos negativos.b. Prueba de los rangos con signo de Wilcoxon.

OHITURA2–

OHITURA1

Page 283: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitzen interpretazioa oso erraza da. Bi bertsioetan, talde bakoitzeko elementu-kopurua (13 eta 96),ordenen baturak (227.50 eta 5767.5), ordenen batezbestekoak (17.50 eta 60.08), eta behealdean 6.1.3.bertsioan eta beheko taulan 7.5. bertsioan, banaketa normalari dagokion z balorea ( -8.3850) eta lortuditugun emaitzak zoriz lortzeko daukagun probabilitatea, adierazgarritasun-maila, (.00000) topatukoditugu.

271Batezbestekoen konparaketa

Page 284: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 285: Estatistika teoria eta praktika SPSSWIN erabiliz

9. BI TALDE BAINO GEHIAGOREN BATEZBESTEKOEN KONPARAKETA

9.1. FAKTORE BATEN BARIANTZA-ANALISIA

9.2. EMAITZAK SPSSWIN ERABILIZ

9.3. BIGARREN ADIBIDEA

9.4. HIRUGARREN ADIBIDEA

9.5. PROBA EZ-PARAMETRIKOA: KRUSKAL-WALLIS-EN H PROBA

9.6. 2 FAKTOREKO BARIANTZAREN ANALISIA

9.6.1. Elkarrekintza

Page 286: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 287: Estatistika teoria eta praktika SPSSWIN erabiliz

275

9. BI TALDE BAINO GEHIAGOREN BATEZBESTEKOEN KONPARAKETA

Aurreko kapituluan bi lagineko batezbestekoetan inferentziak egiten dituzten edo eragiten uzten dutenprozedurak aztertu ditugu. Horretarako, Student-en T testa, Mann-en U froga eta Wilcoxon-en W erabiliditugu.

Gai honetan 2 batezbesteko baino gehiago konparatuko ditugu; bi talde baino gehiagoren batezbes-tekoak konparatuko ditugu. Horretarako bi aldagairekin lan egingo dugu, bata koalitatiboa, nire datuakmaila edo kategoria desberdinetan neurtuko dizkidana, eta bestea, koantitatiboa, batezbestekoak konpa-ratu nahi direlarik. Aldagai koalitatiboa faktore izendatuko dugu.

Faktore bateko bariantzaren analisia izendatuko dugu, nire lagina aldagai bakar baten ezaugarrien ara-bera zatitzen dudan kasua. FAKTORE BATEKO BARIANTZAREN ANALISIA erabil litekeeneko zenbait adi-bide dituzu hauek: A, B edo D ereduetako ikastetxeetako matematikako emaitzak konparatzea, edo lagi-na probintzia ezberdinetakoak osatzen dutenean (bi baino gehiago direnean), edo 3 botika ezberdineneraginkortasuna konparatu nahi dugunean,...

Kasu hauetan, guztietan, faktore bakar batekin ari naiz lanean; sailkatzeko irizpide bakar batekin.Faktore (aldagai) zehatz bat duen kategoria bakoitzari Maila deituko diogu. Horrela EREDUA aldagai edofaktoreak 3 maila dituela esango dugu: A, B eta D. Edota PROBINTZ aldagaiak, gure kasuan, 4 mailadituela: Araba, Gipuzkoa, Bizkaia eta Nafarroa.

Zenbaitetan, bi aldagai/faktore koalitatibo edo gehiago gurutzatuta lortutako taldeen batezbestekoakkonparatu nahi izaten dira. Kasu hauetan BI FAKTORE EDO GEHIAGOREN BARIANTZAREN ANALISIAZarituko naiz. Horrela, 3 botika desberdinen eraginkortasuna konparatu nahi badut gizonezko eta emaku-mezkoetan, lagineko pertsonak sailkatzeko garaian, bi irizpide (2 faktore) erabiltzen ariko naiz: botika--mota eta sexua. Baina era berean jendea, arrisku-taldekoa den edo ez denaren arabera zatitu nahi badut,hirugarren faktore bat sartzen ari naiz, baina... horrela, nahi genituzkeen aldagai edo faktore guztitara oro-kortuz joan gintezke.

Emaitzen orokortze-prozesu honetan gogoan izan behar dugun gauza bakarra hau da: sailkapen--faktore edo -irizpideak sartzen goazen heinean, subjekturik gabe gera gintezkeela, gurutzaketa-kopuruaeta ondorioz, kategoria-kopurua gehitzen baikoaz. Hau da, pentsa dezagun gure laginean 300 pertsonaditugula: 150 gizonezko eta 150 emakumezko. Hauengan hiru botikak duten eragina aztertu nahi bada,botika bakoitzarentzat 50 gizonezko eta 50 emakumezko izango ditut. Era berean, lagina arrisku--taldekoak diren edo ez direnetan banatu nahi badut, jada arrisku-taldekoak diren 25 gizon gera litezkebotika bakoitzarekin eta arrisku-portaerarik ez dituzten 25 gizon botika bakoitzarekin. Berdin gertatzenda emakumeekin. Beste faktore bat sartzen badugu, talde bakoitzaren azken tamaina hainbeste txiki lite-ke, azkenean ezinezkoa izango litzaigukeela analisi hau hainbeste faktorerekin aplikatzea. Zeren frogahau aplikatzeko bete behar den baldintzetako bat subjektu-kopuru minimo bat izatea da: egile ezberdi-nek, frogaren aplikaziorako, orientazio gisa kategoria bakoitzeko 30 elementuren aipamena egiten dute.

Analisi edo azterketa hau erabili ahal izateko beste zein aplikazio-baldintza bete behar dira?

Froga hau egiteko lau dira, normalki, gogoan izan behar ditugun baldintzak:

1.- Talde ezberdinetako datuak populazio normal batetik zoriz hautatuak izan dira.

2.- Erroreak modu askean sailkatzen dira, edo berdin sailkatuak daude.

3.- Talde ezberdinetako datuen artean ez dago korrelaziorik.

4.- Talde ezberdinetako bariantzak berdinak dira.

Horrela ez balitz, dagozkien egokitzapenak egin beharko genizkieke.

Nahikoa aplikazio-baldintza estuak dira, baina frogaren sendotasuna dela eta desbideratze txikiek lor-tutako emaitzak ez dizkigute gehiegi desitxuratuko.

Page 288: Estatistika teoria eta praktika SPSSWIN erabiliz

Aurrera egin aurretik, bariantzaren azterketaren testuinguruan ohizkoak diren zenbait gairen errepasolabur bat egin nahi nuke, hasieratik garbi edukitzea komeni baita.

Gogoan izan behar dugu azterketa edo analisi honek diseinu esperimentalekin lotura handia duela,eta horregatik hitz egiten da diseinu orekatu eta ez-orekatuaz, batzuetan bariantzaren analisi orekatu edoez-orekatura ere zabaltzen delarik. Taldeen neurria berdina den ala ez ematen digu aditzera, soilik.Kategoria guztietan kasu-kopurua berdina bada, diseinu orekatuez ariko gara, bestela diseinu ez--orekatuez.

Efektu fijo eta efektu aleatorioez ere hitz egiten da. Imajina ditzagun bi egoera hauek. A, B eta D ere-duetako matematikako emaitzak konparatu nahi ditugu. Hemen kategoria bakoitzak bere burua bakarrikordezkatzen du. Hiru kategoria daude eta nik hiruren batezbestekoak konparatu nahi ditut. EFEKTU FIJO-EN diseinu batez ari gara. Honi kontrajarriz, ikus dezagun beste egoera bat. Gari-ekoizpenean ongarri--kopuruak duen eragina aztertu nahi dut. Horretarako 4 maila edo ongarri-kopuru hautatzen ditut: 10, 20,30 eta 40 unitate. Eta lau mailen emaitzak konparatzen ditut. Baina kasu honetan ez ditut ongarri-kopuruedo maila posible guztiak ordezkatzen; 15, 25... ongarri-unitateez hitz egin nezakeen. Maila posibleenlagin bat besterik ez dut hartu. Gero, emaitzak orokortu egin nahiko ditut. EFEKTU ALEATORIOKO disei-nu batez ari naiz oraingoan.

Analisiaren helburuetako bat, faktore bakoitzeko kategoria edo maila ezberdinen arteko diferentziakzenbateraino diren aipatutako faktore edo aldagai koalitatiboagatik aztertzea da. Portzentaia hau neur-tzeko indize estatistiko bat erabiliko dugu, korrelazio-koefizientearen interpretazio berdintsua izanik, ETAizendatuko duguna. Korrelazio-koefizientearen kasuan bere berredura erabiltzen genuen bezala, determi-nazio-koefizientea, kasu honetan ere gauza bera egingo dugu, eta normalki estatistiko hau erabiliko dugu:ETA Karratua. Koefiziente hau ez dugu gure emaitzen artekotzat hartuko, baina faktoreagatik azaldu denbariantza-portzentaiari buruz ari dela zehaztu nahi nuen.

GEROKO EGIAZTAKETAK (POST HOC). Hiru edo talde gehiagoren batezbestekoak konparatzekogaraian, batezbestekoak berdinak edo desberdinak direla ondoriozta dezakegu. Nire ondorioa batezbes-tekoak berdinak direla bada, hemen amaitu da analisiaren prozesua. Baina nire ondorioa batezbesteko-ak ezberdinak direla bada, berehala ondorengo galdera hau sortzen da: Zein batezbesteko dira ezberdi-nak? Zein kategoriari dagozkie ezberdinak diren batezbesteko pareak? Galdera honi erantzuteko gerokoegiaztaketak egiten dira. Hauetatik erabilienak Scheffé eta Bonferroni dira. Hauek SPSSWINen emaitzakaurkeztean aztertuko ditugu.

NEURRI ERREPIKATUAK. Aurreko gaian ikusi dugun bi taldeen konparaketaren kasuan, neurri errepi-katu edo datu binakatuen diseinuari egin diogu erreferentzia. Kasu honetan ere, hitz egiteko modu bere-az ariko ginateke. Hemen, bere izaera eta garrantzia besterik ez dut aditzera eman nahi, zeren eta ez ditutjorratuko ez gai honetan, ezta liburu honetan ere.

Aurreko gaian bezalaxe, froga parametriko eta ez-parametrikoez hitz egin dezakegu. Bariantzarenanalisia aplikatzerakoan, lehen azaldutako aplikazio-baldintzak izan beharko ditugu gogoan. Baldintzahauek ez betetzeak, zenbaitetan, froga ez-parametrikoekin lan egitera eramango gaituzte. Kasu honetanaldagai askeez ari gara eta gai honetan aztertuko dugun bakarra izanik, bariantzaren analisia ordezkatu-ko duen KRUSKAL-WALLISen froga ez-parametrikoaren oinarriak, emaitzak lortzeko prozedura eta fro-garen interpretazioa aurkeztuko ditugu.

Jarraian faktore baten bariantza-analisiaren oinarriak modu intuitiboan aurkeztera joko dut, ondoren,SPSSWIN paketearekin lan egiteko modua aztertzeko.

9.1. FAKTORE BATEN BARIANTZA-ANALISIA

Demagun hiru ikastetxetako emaitzak ebaluatu behar ditugula. Ikastetxe bakoitzeko ikasle guztiak eba-luatzeko astirik ez dugunez, bakoitzeko 5 ikasle hautatzen ditugu zoriz.

276

Page 289: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitzak ondorengo taulakoak dira:

IKASTETXEA Ikasleen emaitzak -X

AAAAA 84 97 87 85 77 86

BBBBB 161 163 169 176 151 164

DDDDD 121 111 116 121 111 116

-X orokorra = 122

Emaitza hauen aurrean bi galdera sinple bururatzen zaizkigu: Emaitza ezberdinak al dituzte hiru ikas-tetxeak? Eta baiezkoa balitz, zertan ezberdintzen dira?

Hiru ikastetxeetan emaitza berdinak lortu arren bakoitzeko 5 subjektuko lagina bakarrik aukeratzean,zorteak AAAAA ikastetxeari jukutria gaiztoa egin izana gerta liteke. Edo benetan, AAAAA ikastetxeakDDDDD eta BBBBB ikastetxeek baino emaitza okerragoak lortzea ere gerta liteke.

Ditudan datuak hauek dira eta erabaki bat hartu behar dut. AAAAA ikastetxearen batezbestekoa 86 da,BBBBBrena 164 eta DDDDDrena 116, batezbesteko globala 122 den bitartean.

Taldeen emaitzak konparatzeko garaian zertan jarri beharko dugu arreta? Erabakia hartzeko garaianhiru izango dira oinarrizko puntuak:

– Lehenengoa, noski!, ikastetxe bakoitzeko emaitzen batezbestekoen diferentzia izango da.

– Bigarrena, ikastetxe bakoitzean hartu dudan ikasle-kopurua izango da. Zoriak, zorteak, paper garran-tzitsuagoa izango du ikastetxe bakoitzeko 5 subjekturekin lan egitean, zoriz hautatutako 100 ikaslere-kin lan egitean baino. Beraz, laginak ongi hautatuak dauden guztietan, laginaren tamaina handitzeanerrore-iturrietako bat txikitu egingo da.

– Eta hirugarrengoa, oso garrantzitsua, ikastetxe bakoitzeko emaitzen barneko aldagarritasuna da. Bestemodu batez esanda, ikastetxe bakoitzeko emaitzen homogeneotasuna. Adibide erraz batez ikusikodugu:

Ikastetxea Ikasleak X

AAAAA 5 5 5 5 5 5 5

BBBBB 6 6 6 6 6 6 6

DDDDD 6 6 6 6 6 0 5

EEEEE 5 5 5 5 5 11 6

FFFFF 4 5 6 5 7 3 5

GGGGG 3 7 5 8 4 4 5.16

Kasu honetan BBBBB eta EEEEEko ikasleek batezbesteko bera dute: 6; AAAAA eta DDDDDkoek ereberbera dute. Halere, emaitzak zehatz-mehatz aztertzeko garaian, BBBBBko emaitzak AAAAAkoak bainohobeak diruditela ikus dezakegu. EEEEE eta DDDDDkoak konparatzean berdinak ez direla ikusten dugu.EEEEEko batezbestekoa DDDDDkoa baino handiagoa izan arren, datu hauekin bakarrik gure alabarentzatikastetxe bat hautatu beharko bagenu, zein hautatuko genuke? DDDDD izan liteke eta ikasle baten 0balioa zoriaren ondoriotzat onar genezake, edo... auskalo. Aldiz, errealitatea, ia inoiz ez da lehenengolau kasuetan bezala izango. Topatuko dugun errealitateak FFFFF eta GGGGG ikastetxeen antza handia-goa izango du.

Ikastetxeetako batezbestekoak konparatzeko garaian, bakoitzeko datuen barneko homogeneotasunagogoan izan beharreko alderdietako bat dela garbi geratu dela uste dut.

Laburbilduz, hiru izango dira kontuan hartu beharreko alderdiak: ikastetxe bakoitzeko batezbestekoa,ikastetxe bakoitzean dudan datu-kopurua eta ikastetxe bakoitzeko homogeneotasuna.

277Bi talde baino gehiagoren batezbestekoen konparaketa

Page 290: Estatistika teoria eta praktika SPSSWIN erabiliz

Aurrera.

Hala ere, bi mailako diferentziaz ari gara; alde batetik, ikastetxe ezberdinetako batezbestekoen artekodiferentzia edo distantziaz eta bestetik, talde bakoitzaren barneko diferentzia edo distantziaz. Hauek dirakontrastatuko ditudan bi diferentzia/distantzia-mota ezberdinak. Eta bariantzaren analisiaren oinarri teo-rikoa, modu laburrean, hemen azaltzen den bezain sinplea da:

1.- Ikastetxeetako batezbestekoen arteko diferentzi/distantziak txikiak badira eta ikastetxe bakoi-tzaren barneko datuen arteko diferentziak handiak badira, nire erabakia zentru ezberdinetakoemaitzak berdinak direla izango da. Ikastetxeetako emaitzen artean ezberdintasun gutxi bada-go, baina barnean, ikastetxe bakoitzeko emaitzak oso aldakorrak badira, homogeneotasungutxikoak: FFFFF eta GGGGG ikastetxeen kasua, nire erabakia ez da izango hainbeste emaitzakberdinak direla baieztatzea, ezberdinak direla erabaki ezin dudala baieztatzea bezala.

2.- Ikastetxeetako batezbestekoen arteko diferentziak handiak badira eta ikastetxe bakoitzaren bar-neko datuen arteko diferentziak txikiak badira nire erabakia batezbestekoak ezberdinak direlaizango da. AAAAA eta BBBBB ikastetxeen kasua.

Noski, asko sinplifikatu dut, zeren eta errealitatea ez da inoiz hain garbi azaltzen, eta bestalde, zeresan nahi du diferentzia handi edo txikiak? Nola konpara ditzaket talde bakoitzaren barnean ematen direndiferentzia edo distantziak taldeen artean ematen diren distantzia edo diferentziekin? Bariantzaren anali-sia galdera hauei erantzuteko modu bat besterik ez da. Gogora dezagun bariantza, distantzia baten karra-tua besterik ez dela. Analisi honetan, etengabe, neurri horrekin lan egingo dugu: Distantziaren karratu-ekin.

Bestalde, talde edo ikastetxe ezberdinen arteko distantziak talde bakoitzaren barneko distantziekinkonparatzeko, prozesua oso erraza da. Taldeen ARTEKO batez besteko distantzia eta taldeen BARNEKObatez besteko distantzia kalkulatuko ditut, ondoren, bi distantzien arteko zatiketa egiteko. Zatiketa honenemaitzari F izena emango diogu, F honek Snedeckor-en banaketa segitzen duela froga daiteke, eta bana-keta honetan zoriz lortzeko dagoen probabilitatea kalkulatuko dugu; kasu bakoitzean erabaki egokiahartu ahal izateko jakin behar dugun probabilitatearen balioa da.

Modu grafikoan azalduta, distantzien eskema orokorra ondorengoa da:

Adierazi berri dudan hau prozedura teorikoa da, baina ikus dezagun kalkuluaren prozedura zein den,ikastetxe bakoitzeko bost ikaslerekin planteatu dudan adibide errazean.

278

Talde arteko distantzien batezbestekoaF = ––––––––––––––––––––––––––––––––––

Talde barneko distantzien batezbestekoa

Page 291: Estatistika teoria eta praktika SPSSWIN erabiliz

Gogora ditzagun gure datuak:

IKASTETXEA Ikasleen emaitzak -X

AAAAA 84 97 87 85 77 86

BBBBB 161 163 169 176 151 164

DDDDD 121 111 116 121 111 116

-X orokorra = 122

Zeintzuk dira datuen arteko distantziak?

Distantzia-mota ezberdinak kalkulatuko ditugu (distantzien karratuak).

Lehenengo mota, distantzia edo diferentzia orokorrena da. Hau da puntuazio bakoitzetik batezbeste-ko orokorrera dagoen distantziaren karratua: 122.

Horrela kalkulatzen dugu:

DISTANTZIA OROKORREN BATURA = (84 – 122)2 + (97 – 122)2 + (87 – 122)2 + (85 – 122)2 +

(77 –122)2 + (161 – 122)2 + (163 – 122)2 + (169 – 122)2 + (176 – 122)2 + (151 – 122)2 + (121 – 122)2 +

(111 – 122)2 + (116 – 122)2 + (121 – 122)2 + (111 – 122)2 = 16136

Bigarren distantzia-mota (beti karratua) taldeen barnekoa da.

AAAAA ikastetxearen barneko distantzien karratuen batura=

(84 – 86)2 + (97 – 86)2 + (87 – 86)2 + (85 – 86)2 + (77 – 86)2= 208

BBBBB ikastetxearen barneko distantzien karratuen batura=

(161 – 164)2 + (163 – 164)2 + (169 – 164)2 + (176 – 164)2 + (151 – 164)2= 348

DDDDD ikastetxearen barneko distantzien karratuen batura=

(121 – 116)2 + (111 – 116)2 + (116 – 116)2 + (121 – 116)2 + (111 – 116)2= 100

Eta hemendik taldeen barneko distantzien karratuen batura 656 da.

208 + 348 + 100 = 656

Taldeen arteko distantzia kalkulatzea baino ez zait falta. Modu azkarrean egiteko, talde bakoitzekobatezbestekoen eta batezbesteko orokorraren artean egingo dut. Batezbesteko bakoitzak talde bakoitze-ko bost elementuak ordezkatzen dituenez, distantzia bakoitzaren karratua bider 5 egingo dut.

Ikastetxe arteko Distantzien BATURA =

5 * (86 – 122)2 + 5 * (164 – 122)2 + 5 * (116 – 122)2 = 15480

Jadanik, erabiliko ditugun hiru distantziak baditugu.

Distantzien kalkuluaren eta talde edo ikastetxe bakoitzaren barneko bariantzak taldeen arteko barian-tzekin konparatzeko prozesu orokorra dela eta, analisi honek BARIANTZAREN ANALISIA izena hartzendu.

Gai garrantzitsu bat jorratzea falta zaigu: ASKATASUN-GRADUAK.

279Bi talde baino gehiagoren batezbestekoen konparaketa

Page 292: Estatistika teoria eta praktika SPSSWIN erabiliz

Gai hau, bai Ji karratuaren proban eta baita Studenten T proban ere jorratu dut. Kasu honetan konno-tazioa piska bat aldatzen denez, berriro ere azaldu egingo dugu.

ASKATASUN-GRADUEZ hitz egitea kasu askeen kopuruaz hitz egitearen baliokidea da. Zentzu hone-tan, hiru datu izanik, hirugarrenaren balioa galtzen badut, baina batezbestekoaren balioa ezagutzenbadut, hirugarrenaren balioa lortu ahal izango dut. Adibidez: hiru datu ditut: 2, 4 eta? Hirugarren datuafalta zait, baina badakit batezbestekoa 6 dela; orduan, datuen baturak 18 behar du izan, eta beraz, derri-gorrez, hirugarren datua 12 da.

Horregatik, hiru datuetatik bi askeak direla esango dut. Datu-talde guztietan, azkenengoa aurrekoeta-tik lortu ahal izango dut. Beraz, 15 datu baditut, 15. datua aurreko 14etatik lortu ahal izango dut. 14askatasun-gradu dituela esango dut. Estatistikan, askatasun-gradu kontzeptua, beti, datu-kopuruari, kate-goriari, mailei eta aldagai askeei dagokie.

Kasu bakoitzean askatasun-graduak zein izan dira?

- Distantzia orokorren kasuan: 14 (15 subjektu -1)

Ikastetxe bakoitzaren BARNEAN: AAAAA-n 4, BBBBB-n 4 eta DDDDD-n 4. Beraz, orokorrean, ikaste-txeen barnean: 4 + 4 + 4 = 12

- Ikastetxeen ARTEAN: 2 (3 ikastetxe -1)

Azken finean, ditudan distantzia eta askatasun-graduak, taulan jar ditzakegu:

Distantzien batura Askatasun-graduak: df

ikastetxe ARTEAN 15480 2

ikastetxe BARNEAN 656 12

distantzia OROKORRAK 16136 14

Bariantzaren analisiaren abiapuntu-taula da hau. Orain prozesua mekanikoa da. Distantzien baturaezberdinak lortu ditugu baina batugai desberdinetan oinarrituz. Hau da, distantzia orokorrak 15 distan-tziatan oinarrituz lortu ditugu (14 askatasun-gradu); ikastetxe barnekoak ikastetxe bakoitzean 5 distan-tziatan oinarrituz (12 askatasun-gradu), eta ikastetxe artean 3 ikastetxe direnez, 3 distantziatan oinarrituz(2 askatasun-gradu). Batura hauek homogeneizatu egin behar ditugu nolabait, horretarako tarteko distan-tziarekin lan egiten da eta hau, distantzien batura bakoitza zati bere askatasun-gradua eginaz lortukodugu.

Honako taula hau lortuko dugu:

Distantzien batura Askatasun-graduak: df Distantzien batezbestekoa

Ikastetxe ARTEAN 15480 2 7740

Ikastetxe BARNEAN 656 12 54.667

Distantzia OROKORRAK 16136 14

Batezbestekoen arteko diferentzia aztertzeko, bi distantzia konparatuko genituela aipatzen genuen:ikastetxe arteko distantzien batezbestekoa eta ikastetxe barneko distantzien batezbestekoa.Konparaziorako prozedura bezala, F estatistikoa bi batezbestekoen zatiduratik abiatuz kalkulatuko dugu.

280

Page 293: Estatistika teoria eta praktika SPSSWIN erabiliz

Gure kasuan, horrela osatuko dugu taula:

Distantzien BATURA Askatasun-graduak: df Distantzien batezbestekoa F

Ikastetxe ARTEAN 15480 2 7740 141.59

Ikastetxe BARNEAN 656 12 54.667

distantzia OROKORRAK 16136 14

Hau bariantzaren analisiaren taula da; bertan, analisiarekin amaitzeko, F-ren adierazgarritasun-balioalortzea besterik ez zaigu falta. Beste modu batera esanda, F-ren balio hau zoriz lortzeko probabilitateazein den jakitea bakarrik falta zaigu. Balio hau, eskuz lan egiten dugunean, 5. kapituluan azaldutakoSnedeckor-en F-ren tauletan begiratu beharko dugu.

Demagun, tauletan begiratu eta batezbestekoak berdinak izateko probabilitatea oso baxua dela ikus-ten dugula: 0.0000. Zer ondorio aterako dut? Batezbestekoen diferentzia zoriz sortua izatea oso zailabada (ia 0 probabilitatea), “errua” beste arrazoiren bati bota beharko diot. Baina nire diseinuarekin, hiruikastetxeetako emaitzen batezbestekoak ezberdinak direla bakarrik baiezta dezaket; eta nahasteko pro-babilitatea 0.0000 izango dela. Hiru ikastetxeetako emaitzak berdinak diren kasuan nahastuko naiz, etanik lagin hauen diferentziak zoriz .0000ko probabilitatearekin lortu ditut.

Baina berehala, galdera berri bat sortzen da: zein talde edo ikastetxek ditu emaitza ezberdinak?

Honi erantzuteko, geroko egiaztaketa edo POST HOC TEST-ak erabiliko ditugu. Kalkulu hauek ezditugu eskuz egingo, gogaikarria bailitzateke. SPSSWINek, hala eskatuko banio, emaitzen zerrendan inte-gratuko luke.

9.2. EMAITZAK SPSSWIN ERABILIZ

Ondoren, aurreko adibidearen emaitzak SPSSWINekin nola lortu eta berauen interpretazio-arauak eskei-niko ditut. Emaitza hauek lortzeko eman beharreko pausoak zeintzuk diren ere aipatuko dizut. Gero,bigarren adibide batean, liburu osoan zehar garatzen ari garen adibide orokorra berrartuko dugu.

15 ikasleei dagozkien matematikako emaitzen datuak sartuko ditugu lehenik. Horretarako bi aldagaidefinitu ditut: MATEMATI eta IKASTETX, eta liburuaren bigarren zatian emandako arauak jarraituz, hama-bost datuak sartu ditugu.

Datuak tekleatu nahi ez badituzu, edo gogorik ez baduzu, hitzaurrean aipatutako Web orrialdekoANOVA.SAV fitxategia duzu. Ireki ezazu, eta Bariantza Sinplearen Analisiaren emaitzak lortzeko emanbehar dituzun pausoak azalduko dizkizut:

EstadísticosComparar medias

ANOVA de un factor

Eta honen antzeko pantaila bat lortuko dugu, eta bertan dependientes (menpeko) bezala MATEMATIeta Factor bezala Ikastetx hautatu ditugu.

281Bi talde baino gehiagoren batezbestekoen konparaketa

Page 294: Estatistika teoria eta praktika SPSSWIN erabiliz

Darabilkizun SPSSWIN bertsioaren arabera, heina definitzea eskatuko dizu (6.1.3 bertsioan) edo ez dubeharrik izango (7.5 bertsioan).

6.1.3 bertsioa bazaude, “Definir rangos” botoia sakatzean, beste leiho bat aktibatuko zaizu, bertanMinimo eta Maximo botoiak bete beharko dituzu, 1 eta 3 -rekin, hurrenez hurren. Continuar.

“Opciones” botoia sakatu ondoren, beste leiho hau azalduko da eta bertan “Estadisticos descriptivos”hautatuko dut. Continuar.

Ondoren POST HOC-en (geroko egiaztaketa), Scheffé hautatuko dut. Continuar. Aceptar.

282

Page 295: Estatistika teoria eta praktika SPSSWIN erabiliz

6.1.3. bertsioko emaitzak hauek dira:

SPSSWIN 6.1.3

- - - - - O N E W A Y - - - - -

Variable MATEMATI

By Variable IKASTETX

Analysis of Variance

Sum of Mean F F

Source D.F. Squares Squares Ratio Prob.

Between Groups 2 15480,0000 7740,0000 141,5854 ,0000

Within Groups 12 656,0000 54,6667

Total 14 16136,0000

Standard Standard

Group Count Mean Deviation Error 95 Pct Conf Int for Mean

Grp 1 5 86,0000 7,2111 3,2249 77,0464 TO 94,9536

Grp 2 5 164,0000 9,3274 4,1713 152,4187 TO 175,5813

Grp 3 5 116,0000 5,0000 2,2361 109,7918 TO 122,2082

Total 15 122,0000 33,9495 8,7657 103,1994 TO 140,8006

GROUP MINIMUM MAXIMUM

Grp 1 77,0000 97,0000

Grp 2 151,0000 76,0000

Grp 3 111,0000 121,0000

TOTAL 77,0000 176,0000

- - - - - O N E W A Y - - - - -

Variable MATEMATI

By Variable IKASTETX

Multiple Range Tests: Scheffe test with significance level ,05

The difference between two means is significant if

MEAN(J)-MEAN(I) >= 5,2281 * RANGE * SQRT(1/N(I) + 1/N(J))

with the following value(s) for RANGE: 3,94

(*) Indicates significant differences which are shown in the lower triangle

G G G

r r r

p p p

1 3 2

Mean IKASTETX

86,0000 Grp 1

116,0000 Grp 3 *

164,0000 Grp 2 * *

283Bi talde baino gehiagoren batezbestekoen konparaketa

Page 296: Estatistika teoria eta praktika SPSSWIN erabiliz

7.5. bertsioko emaitzak

SPSSWIN 7.5

ANOVA de un factor

Pruebas post hoc

Subconjuntos homogéneos

Eskuz eginiko kalkuluetan lortutako emaitzak kontuan izanik, datuen interpretazioa oso da erraza.6.1.3 bertsioak, lehenik, bariantzaren analisiaren emaitzak aurkezten dizkigu; lehen lortutakoen berdin--berdinak, hain zuzen. Balio ezberdinak errepasa ditzakezu. F-ren balioa (F ratio) lortu ondoren, balio hauzoriz lortzeko probabilitatea aurkezten digu: F prob. = 0.0000. Hemendik aurrera nire ondorioa batez-bestekoak ezberdinak direla izango da.

Emaitzen hurrengo blokean, lan egin dugun talde (ikastetxe) bakoitzaren emaitzak deskribatzen dizki-gu. Ikastetxe bakoitzeko subjektu-kopurua, batezbestekoa, desbideratze tipikoa, errore estandarra, etabaita ikastetxe bakoitzarentzako eta subjektuen osotasunarentzako konfiantza-tartea ere.

Hurrengo blokean, datuen globaltasunaren eta taldeetako bakoitzaren txikiena eta handiena aurkez-ten dizkigu.

284

ANOVA

Suma decuadrados

Mediacuadráticagl F Sig.

MATEMATI Inter-gruposInter-gruposTotal

15480,000656,000

16136,000

21214

7740,00054,667

141,585 ,000

Comparaciones mùltiplesVariable dependiente: MATEMATIScheffé

bbbbb aaaaaddddd

aaaaa bbbbbddddd

ddddd aaaaabbbbb

Diferenciade

medias(I–J)

Errortípico Sig.

Intervalo deconfianza al 95 %

Límiteinferior

Límitesuperior

(I)IKASTETX

(J)IKASTETX

-78,0000*-30,0000*

4,6764,676

,000,000

-91,0352-43,0352

-64,9649-16.9648

78,0000*48,0000*

4,6764,676

,000,000

64,964834,9648

91,035261,0352

-30.0000*-48,0000*

4,6764,676

,000,000

16,9648-61,0352

43,0352-34,9648

* La diferencia entre las medias es significativa al nivel 0.5

MATEMATIScheffa

IKASTETX NSubset for alpha = .05

1 2 3

aaaaadddddbbbbbSig.

555

86,0000

1,000

116,000

1,000164,0000

1,000

Se muestran las medias para los grupos en los subconuntos: homogéneos.a. Uses Harmonic Mean Sample Size = 5,000

Page 297: Estatistika teoria eta praktika SPSSWIN erabiliz

285Bi talde baino gehiagoren batezbestekoen konparaketa

Lehen aipatu dugu Post Hoc edo geroko egiaztaketen garrantzia; galdera honi erantzuten laguntzeandatza: Zein taldek ditu zehazki batezbesteko ezberdinak?

Horretarako, Scheffé-ren egiaztaketa edo kontrastea eskatu dut. Emaitzen interpretazioa guztiz errazada. % 95eko konfiantza-mailan, % 5eko errore-tartearekin lan egitea suposatzen duenak, asteriskobatzuen bitartez batezbesteko ezberdinak dituzten talde-pareak aurkezten dizkigu: kasu honetan 3. tal-dea 1. taldearekin dagoen ilaran, eta 2. taldea 3. eta 1. taldeekin dagoen ilaran dauzkate asteriskoak. Hauda, denak denekin. Beraz, hiru taldeak beraien artean ezberdinak dira (errore-maila honekin).

7.5 bertsioaren emaitzak, lehenengo bi faseetan, beste bertsiokoekin bat datoz. Scheffé-ren Post Hocegiaztaketa-emaitzen aurkezpenean, halere, zertxobait aldatzen da.

Kasu honetan, emaitzen hirugarren taulak, talde bakoitzaren emaitzak beste bienekin konparatzenditu. AAAAA taldeko emaitzak beste biekin konparatuz hasten da. Lehenik, batezbestekoen diferentzia(–78.000), eta errore estandarra (4.676) kalkulatzen ditu, ondoren diferentzia hau zoriz lortzeko probabi-litatea kalkulatzeko; 0.000 kasu guztietan. Ondoren, diferentziarentzako konfiantza-tartea aurkeztendigu. Sinplea. Azkenik homogeneoak diren talde-pareak aurkezten dizkigu. Kasu honetan talde bakoitzabere buruarekin bakarrik datorrela bat ikus dezakegu; hau da, talde guztiek emaitza ezberdinak lortzendituztela berbaieztatzen digu.

Eta honela bukatzen da bariantzaren analisi sinple honen emaitzen interpretazioa.

Ondoren, gure LIBURU.SAV datu-matrizetik hartutako adibide bat ikus dezagun.

9.3. BIGARREN ADIBIDEA

Gure fitxategia, LIBURU.SAV, ireki eta pauso hauek eman:

EstadísticosComparar medias

ANOVA de un factor

Lortuko dugun pantailan, dependiente bezala, MATEMATI hautatuko dugu eta Factor bezala PRO-BINTZ. 6.1.3 bertsioan bazaude, Definir rango... egin beharko duzu eta minimo eta maximoan 1 eta 4idatzi. 7.5 bertsioan ez duzu honen beharrik.

Post Hoc-en hauta ezazu Scheffé. Continuar.

Opciones-en nik “Descriptivos” eta “Homogeneidad de Varianzas” hautatu ditut, emaitzak nola aur-kezten dizkigun ikusteko. 6.1.3 bertsioan ere taldeen etiketak (probintziak) azal daitezen, “ver etiquetas”aktibatuko dut. Bertsio berrian ez dago horren beharrik, beti idazten baititu. Continuar.

Contraste edo egiaztaketak helburu bat dute; adibide honetan erabiliko ez badugu ere (hurrengorakouzten dut), beste baterako gogoan izan dezazun azalduko dut. Demagun hizkuntza-eredu ezberdinetako(A, B eta D ereduetako) haurren euskara-ezagutzak aztertzen ari garela. Eta une jakin batean, hiru talde-en batezbestekoak konparatu beharrean ereduekin 2 kategoria egin nahi ditudala. Hau da, hiru ereduakbi kategoriatan bildu nahi ditudala: alde batetik, A eta B-ko ikasleak eta bestetik, D eredukoak, eta geroemaitzak konparatu. Hau da KONTRASTEEK ahalbidetzen digutena. Aurrera eramateko modua oso erra-za da. Ondorengo adibidera igortzen zaitut, modu paktiko bat ikus dezazun. Adibide honetako aukere-kin amaitu dugu. Aceptar.

Oraingoz ez ditugu kontrasteak aztertuko. Hurrengo adibiderako geratzen da hau. Aceptar.

Page 298: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitzak ondorengo hauek dira:

SPSSWIN 6.1.3- - - - - O N E W A Y - - - - -

Variable MATEMATIBy Variable PROBINTZ

Analysis of Variance

Sum of Mean F FSource D.F. Squares Squares Ratio Prob.

Between Groups 3 821,1079 273,7026 13,1012 ,0000Within Groups 325 6789,7311 20,8915Total 328 7610,8389

Standard StandardGroup Count Mean Deviation Error 95 Pct Conf Int for Mean

BIZKAIA 92 23,7283 3,9865 ,4156 22,9027 TO 24,5538NAFARROA 77 23,3247 5,1795 ,5903 22,1491 TO 24,5003ARABA 88 26,2386 4,8257 ,5144 25,2162 TO 27,2611GIPUZKOA 72 21,8194 4,2437 ,5001 20,8222 TO 22,8167Total 329 23,8875 4,8170 ,2656 23,3651 TO 24,4100

GROUP MINIMUM MAXIMUM

BIZKAIA 15,0000 31,0000NAFARROA 4,0000 32,0000ARABA 10,0000 34,0000GIPUZKOA 11,0000 32,0000

TOTAL 4,0000 34,0000

Levene Test for Homogeneity of Variances

Statistic df1 df2 2-tail Sig.2,0755 3 325 ,103

- - - - - O N E W A Y - - - - -Variable MATEMATI

By Variable PROBINTZ

Multiple Range Tests: Scheffe test with significance level ,05

The difference between two means is significant ifMEAN(J)-MEAN(I) >= 3,2320 * RANGE * SQRT(1/N(I) + 1/N(J))with the following value(s) for RANGE: 3,97

(*) Indicates significant differences which are shown in the lower triangle

G NI A B

P F IU A Z AZ R K RK R A AO O I BA A A A

Mean PROBINTZ

21,8194 GIPUZKOA23,3247 NAFARROA23,7283 BIZKAIA26,2386 ARABA * * *

286

Page 299: Estatistika teoria eta praktika SPSSWIN erabiliz

7.5. bertsioko emaitzak...

SPSSWIN 7.5

ANOVA de un factor

Pruebas post hoc

Subconjuntos homogéneos

Emaitzak interpretatzeko, ikus dezagun lehen zein diren oinarrizko zatiak. Aurreko kasuetan bezala,emaitzen aurkezpen-ordena aldatu egiten da, nahiz eta hauek, logikoki, bat datozen.

287Bi talde baino gehiagoren batezbestekoen konparaketa

ANOVA

Suma decuadrados

Mediacuadráticagl F Sig.

MATEMATI Inter-gruposInter-gruposTotal

821,2086789,7317610,839

3325328

273,70320,891

13,101 ,000

Comparaciones mùltiplesVariable dependiente: MATEMATIScheffé

Diferenciade

medias(I–J)

Errortípico Sig.

Intervalo deconfianza al 95 %

Límiteinferior

Límitesuperior

(I)PROBINTZ

(J)PROBINTZ

2,39-,603,93

* La diferencia entre las medias es significativa al nivel 0.5

BIZKAIA NAFARROAARABABIZKAIA

,40*-2,51*

1,91

,706,682,719

,955,004,073

-1.58-4,43

-11

NAFARROA BIZKAIAARABAGIPUZKOA

-,40-2,911,51

,706,713,749

,955,001,260

-2,39-4,92

-60

ARABA BIZKAIANAFARROAGIPUZKOA

2,51*2,91*4,42*

,682,713,726

,004,001,000

,60,91

2,38

GIPUZKOA BIZKAIANAFARROAARABA

-1,91-1,51-4,42

,719,749,726

,073,260,000

-3,93-3,61-6,46

1,58-,913,61

4,434,926,46

,11,60

-2,38

MATEMATIScheffa b

PROBINTZ NSubset for alpha = .05

1 2

GIPUZKOANAFARROABIZKAIAARABASig.

72779288

21,8223,3223,73

,07126,241,000

Se muestran las medias para los grupos en los subconuntoshomogéneos.a. Uses Harmonic Mean Sample Size = 81,451b. Los tamaños de los grupos no son iguales. Se utilizará la media armónica de los tamaños de los grupos. Los niveles de error del tipo 1 no están garantizados.

Page 300: Estatistika teoria eta praktika SPSSWIN erabiliz

6.1.3 bertsioaren aurkezpen-ordena hau da: bariantzaren analisiaren taula, taldeen deskribapena,bariantzen konparaketarako Leveneren Testa eta Scheffé-ren Post Hoc testa. 7.5 bertsioan ordena hau da:taldeen deskribapena, bariantzen konparaketarako Levene-ren Testa, bariantzaren analisiaren Taula, etaScheffé-ren Post Hoc testa.

7.5 bertsioaren ordena jarraituko dut (bat hautatu behar eta).

Taldeen deskribapena oso erraza da. Subjektu-kopurua (N), batezbestekoa (Mean), desbideratze tipi-koa (Std. Deviation), errore estandarra (Std. error), batezbestekoarentzako konfiantza-tartea % 95ean,talde bakoitzarentzat txikiena (minimoa) eta handiena (maximoa), eta datu guztiena ere aurkezten dira.Bloke honetan, talde ezberdinen batezbestekoen artean nahiz berauen bariantzen artean dauden dife-rentzien ideia bat egin dezaket.

Studenten T testean bezala, talde ezberdinen bariantzak aztertuko dira bariantzaren analisia aplikatuahal izateko ezinbesteko baldintza baita talde guztietako bariantzak homogeneoak izatea. “homoredasti-zitatea” izeneko baldintza da hau.

Bariantzen homogeneotasuna Levene-ren Testarekin aztertuko da, eta honen emaitzak beheko bloke-an azalduko dira. Hemen emaitzak oso ulerterrazak dira: lehenik Levene-ren estatistikoa aurkezten digu:2.0755 (2.076). Ondoren, askatasun-graduen bi zenbaki aurkezten dizkigu: df1 = 3 (talde-kopurua -1), etadf2 = 325 (elementu-kopurua - talde-kopurua). Ondoren, 4. taldeko bariantzen artean lortzeko dagoendiferentziak zoriz lortua izateko probabilitatea azaltzen zait: 0.103.

Betiko galdera: emaitza hau ikusi ondoren, zer erabaki hartuko dut bariantzen berdintasunari dago-kionez? Diferentzia hauek zoriz lortzeko probabilitatea 0.05 baino handiagoa denez, ez dut bariantzenberdintasunaren hipotesia baztertuko, beraz bariantza berdinak direneko ustean lan egingo dut.Bariantzak ezberdinak direla erabaki izan banu, 100etik 10.3tan nahastuko nintzateke. Portzentaia han-diegia litzateke.

Orain 7.5 bertsioan bariantzaren analisiaren taulara iristen gara eta 6.1.3 bertsioan emaitzen hasiera-ra itzultzen gara aurkitu ahal izateko.

Taula honetako datuen arabera, batezbestekoak berdinak edo ezberdinak diren erabakiko dugu. Taulahonetan agertzen den balioen segida, lehenengo adibidean eskuz egin duguna bera dela ikusten dugu.Hiru distantzia-moten karratuen baturak aurkezten dizkigu lehenik. Taldeen artean (between): 821.1079,taldeen barnean (within): 6789.7311 eta orokorra: 7610.8389. Ondoren, 7.5 bertsioan, askatasun--graduak, 6.1.3 bertsioan aurretik azaltzen direnak. Gogora ezazu beti datu askeen adierazle direla.Taldeen arteko distantzien kasuan, talde-kopurua ken bat da; taldeen barneko distantzien kasuanelementu-kopurua ken talde-kopurua da, eta distantzia orokor edo totalen kasuan berriz, elementu--kopurua ken 1 da. Jarraian, batezbesteko koadratikoak kalkulatzen ditu: Mean Square, distantzien batu-rak zati askatasun-graduak. Azkenik, Fa balioa taldeen arteko batezbesteko koadratikoa zati taldeen bar-neko batezbesteko koadratikoa eginda lortutako emaitza bezala kalkulatzen du (F = 13.101).

Amaitzeko F-ren balio hau zoriz lortzeko probabilitatea azaltzen da: 0.0000.

Hemendik aurrera zer erabaki hartuko dut? Erantzuna garbi dago. Emaitza hauek zoriz lortzeko pro-babilitatea 0.0000 denez, diferentzia hauek zortearen eraginez lortzea ia ezinezkoa dela adierazten arizait. Eta diferentzia hauek zoriz ematen ez badira taldeetako batezbestekoak ezberdinak direlako eman-go dira. Hauxe da, beraz, emaitzak aztertu eta gero, nire ondorioa.

Orain beste galdera bat. Batezbestekoak ezberdinak dira, baina zein taldek dituzte beraien arteanbatezbesteko ezberdinak? Galdera honen erantzuna Scheffé-ren probak eskaintzen dit; proba hau, bada-ezpada ere, Post Hoc-en leihoa betetzerakoan, aurrez egiteko eskatu genion.

Emaitza hauek 6.1.3 bertsioan interpretatzea oso sinplea da.

288

Page 301: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitzen funtsa hemen aurkezten dizudan hau da:

G N

I A B

P F I

U A Z A

Z R K R

K R A A

O O I B

A A A A

Mean PROBINTZ

21,8194 GIPUZKOA

23,3247 NAFARROA

23,7283 BIZKAIA

26,2386 ARABA * * *

Asteriskoak, % 5eko errore-mailarekin, beraien artean ezberdinak diren talde-pareak adierazten diz-kit. Kasu honetan, Arabako emaitzak gainerako probintzietatik % 5ean desberdinak direla ikusten dugu.Gipuzkoakoak, baxuenak izan arren, gainerantzekoak baino txikiagoak direla erabakiko banu, nahastekoizango nukeen probabilitatea % 5 baino handiagoa litzateke, horregatik, ezin dut zentzu honetan eraba-ki bat hartu.

7.5 bertsioan emaitza hauek berak itxura zertxobait aldatuta aurkezten zaizkit. Lehenik, talde guztienbatezbestekoen konparaketa anizkoitzen taula aurkezten da. Garbi ikusten da batezbestekoak ezberdinakdituzten talde-pareak zein diren. Hau da, beraien diferentziak zoriz izateko probabilitatea .05en azpitikduten talde-pareak zein diren. Zerrenda egin ezazu eta hauek direla ikusiko duzu:

Bizkaia-Araba (.004) eta -2.51eko diferentzia.Nafarroa-Araba (.001) eta -2.91eko diferentzia.Gipuzkoa-Araba (.000) eta -4.42ko diferentzia.

Eta Araba aurreko probabilitate denekin eta, noski, diferentzia berak baina zeinu positiboarekin. Taulaosatzeko, talde-pare bakoitzaren batezbestekoen diferentzientzako konfiantza-tartea % 95ean ezarri da.

Azkenik, probintziak aurkezten dizkigu, batezbesteko berdinak dituztenak talde berean azal ditezen.Erraza.

9.4. HIRUGARREN ADIBIDEA

Adibide honetan, bariantzaren analisi bateko beste emaitza batzuk laburki aurkeztuko dizkizut, bertan ereSPSSWINek KONTRASTEAK erabiltzeko ematen didan aukeraz baliatuta. Aurreko adibidean ikusi dugunbezala, bi bertsioetan emaitzak eta pantailak baliokideak direnez, 6.1.3 bertsioko leiho eta emaitzakbakarrik aurkeztuko ditut; 7.5 bertsioan baino pausoren bat edo beste gehiago eman behar delako, hau-tatu dut bertsio hau. Horrela, bi bertsioetarako baliagarria suertatzen da.

Planteamendua ondorengoa da: Hego Euskal Herriko lau probintzietako ikasleek lortutako ingeleseko(INGELES) emaitzak konparatu nahi ditugu. Horretarako, lau probintzietako ikasleen lagin adierazgarriabadugula suposatzen dugu. Lehenik, lau batezbestekoak konparatuko ditugu. Orain arte lehen bezala,egingo dugu, baina badago alde bereizgarri bat: bi probintzia-talde egin nahi ditugu. Alde batetikNafarroa eta Araba eta bestetik, Gipuzkoa eta Bizkaia. Eta orain bi taldeen emaitzak konparatu nahi ditut.Analisi hau da faktore bateko ANOVAren leihoan azaltzen diren KONTRASTEEN bitartez SPSSWINek egi-ten uzten didana.

289Bi talde baino gehiagoren batezbestekoen konparaketa

Page 302: Estatistika teoria eta praktika SPSSWIN erabiliz

LIBURU.SAV fitxategia kargatu ondoren, emaitzak lortzeko eman beharreko pausoak hauexek dira:

EstadísticosComparar medias

ANOVA de un factor

Eta honen antzeko leiho bat lortuko dut (6.1.3) bertsioan:

Lista de independientes-en INGELES aldagaiasartu dut, eta factor-en berriz, PROBINTZ. Azkenhonen ondoan bi galdera-ikur azaltzen zaizkit, etahorrek heina definitu behar dudala adierazten dit.Horretarako, Definir rango... botoia sakatu etahonako beste leiho hau lortuko dut, bertan 1 eta 4balioak sartu ditudalarik Mínimo eta Máximon,hurrenez hurren. Konparatu nahi ditudan lau pro-bintziei eman dizkiedan balioak dira. Continuar.

Ondoren Contrastes botoia sakatu eta, leiho hau lortzen dut, bertan koefizienteen atala bete dudala-rik. Horretarako pauso hauek eman ditut.

290

Page 303: Estatistika teoria eta praktika SPSSWIN erabiliz

Koefizienteen laukitxoa aktibatzen dut, kurtsorea bere gainera eraman eta sakatuz. Ondoren hau idaz-ten dut. (Gogoratu 0 eta koma”,” idatzi behar dela ez 0.5 puntua ez du onartzen).

0,5 (Añadir)- 0,5 (Añadir)- 0,5 (Añadir)0,5 (Añadir)

Zein da segida honen esanahia? Probintzia bakoitzari eman dizkiodan balioak hauek dira: 1 Bizkaia,2 Nafarroa, 3 Araba eta 4 Gipuzkoa. Eta nik 1 eta 4 (Bizkaia eta Gipuzkoa) probintzien emaitzak 2 eta 3(Nafarroa eta Araba) probintzien emaitzekin konparatu nahi ditut. Hau adierazteko modu bat, zehaztuberri ditudan balioak erabiltzea da; ken zeinuak, probintziak bi taldetan zatitzeko dira, positiboak etanegatiboak. 0,5 balioak idatzi ditut bi balio positiboen eta bi balio negatiboen batezbestekoak egin die-zazkidan. Benetan, horrela osatutako bi taldeen batezbestekoak kalkulatzeko esaten ari natzaio:

Talde 1: 0,5 * Bizkaia + 0,5 * GipuzkoaTalde 2: -0,5 * Nafarroa -0,5 * Araba

Continuar.

Opciones-en Descriptivos eta Post Hoc-en, Scheffé hautatzen dut. Aceptar.

Lortutako emaitzak hauek dira:

SPSSWIN 6.1.3

- - - - - O N E W A Y - - - - -

Variable INGELES

By Variable PROBINTZ

Analysis of Variance

Sum of Mean F F

Source D.F. Squares Squares Ratio Prob.

Between Groups 3 332,2458 110,7486 2,1005 ,1001

Within Groups 312 16450,1087 52,7247

Total 315 16782,3544

Standard Standard

Group Count Mean Deviation Error 95 Pct Conf Int for Mean

BIZKAIA 91 28,0769 7,3337 ,7688 26,5496 TO 29,6042

NAFARROA 74 29,6216 6,9098 ,8032 28,0208 TO 31,2225

ARABA 85 29,6824 7,4053 ,8032 28,0851 TO 31,2796

GIPUZKOA 66 27,1818 7,3566 ,9055 25,3733 TO 28,9903

Total 316 28,6835 7,2991 ,4106 27,8757 TO 29,4914

291Bi talde baino gehiagoren batezbestekoen konparaketa

Page 304: Estatistika teoria eta praktika SPSSWIN erabiliz

- - - - - O N E W A Y - - - - -

Variable INGELES

By Variable PROBINTZ

Contrast Coefficient Matrix

BIZKAIA ARABA

NAFARROA GIPUZKOA

Contrast 1 ,5 -,5 -,5 ,5

Pooled Variance Estimate

Value S. Error T Value D.F. T Prob.

Contrast 1 -2,0226 ,8233 -2,457 312,0 ,015

Separate Variance Estimate

Value S. Error T Value D.F. T Prob.

Contrast 1 -2,0226 ,8218 -2,461 293,3 ,014

- - - - - O N E W A Y - - - - -

Variable INGELES

By Variable PROBINTZ

Multiple Range Tests: Scheffe test with significance level ,05

The difference between two means is significant if

MEAN(J)-MEAN(I) >= 5,1344 * RANGE * SQRT(1/N(I) + 1/N(J))

with the following value(s) for RANGE: 3,98

- No two groups are significantly different at the ,050 level

Lortutako emaitzei buruzko azalpen labur ematea komeni da:

Lehenik bariantzaren analisiaren taula aurkezten du eta taula honen amaieran, probintzia ezberdine-tan INGELESeko puntuaketetan ematen diren diferentziak zoriz emateko probabilitatea .1001 dela adie-razten da. Zoriak eragindako probabilitatea handiegia da, hau da, 100etik 10etan zoriz lortuko dira, berazezingo dut ezberdinak direnik esan. Hurrengo taulan probintzia bakoitzeko batezbestekoak, desbideratzetipikoak,... aurkezten dizkigu. Emaitzen amaieran geroko edo Post Hoc-eko konparaketak azaltzen zaiz-kit, bertan aurreko emaitzak baieztatzen direla. “No two groups are significcantly differents...” adieraztendit, hau da errore-maila horretan, % 5ean, ez daudela bi talde ezberdin.

Baina zer gertatzen da bi probintzia-taldeekin egiteko asmoa dudan kontrastearekin?

Probintzia bakoitzaren emaitzen deskribapenaren hurrengo blokean, Studenten T proben kasuanbezala, emaitzen zerrenda bi aurkezten dizkit. Bata, bariantza berdinen kasurako eta bestea, bariantzaezberdinen kasurako. Kasu bakoitzean zein ilara dagokion erabiltzaileak esan beharko du. Dena den, biilaren artean diferentzia handirik ez dagoela froga dezakezu. Bariantza berdinena hautatuko dut; zehatz--mehatz ariko banintz ordea, Leveneren testa egin beharko nuke, bi ilaretatik zein interesatzen zaidanikusteko.

Lehenik, nik ezarritako kontrasteko koefizienteak errepikatzen ditu, eta ondoren kontrastearen balioaaurkezten du. Hau da, bi taldeen batezbestekoak kalkulatzen ditu (Bizkaia eta Gipuzkoa batean, eta

292

Page 305: Estatistika teoria eta praktika SPSSWIN erabiliz

Araba eta Nafarroa bestean), eta diferentzia aurkezten du: -2,0226. Kontrastean koefiziente negatiboare-kin doazen Araba eta Nafarroako batezbestekoa handiagoa denez, diferentzia negatiboa da.

Diferentziaren balioaren ondoren, errore estandarraren balioa ematen du: (0.8233) eta baita T-renbalioa (-2.457) eta askatasun-graduak ere (312, elementu-kopurua - talde-kopurua). Azkenik, diferentziahauek zoriz lortzeko probabilitatea zehazten du: 0.015.

Honenbestez, bi taldeen batezbestekoak ezberdinak direla erabakiko dut, 0.015eko errore-mailarekin.

Ohar zaitez, halere, zein paradoxarekin egiten dugun topo.

Bi taldeak (Bizkaia eta Gipuzkoa, eta Nafarroa eta Araba) INGELESeko emaitzen arabera ezberdinakdirela baiezta dezakegu (0.015eko errore-maila); banan-banan hartzen ditugunean diferentzia hauek ezdira esanguratsuak (ezta 0.05eko errore-mailarekin ere), nahiz eta bi probintzien arteko banakako dife-rentziak -2.0226 baino handiagoak izan. Araba eta Gipuzkoaren arteko diferentzia 2.50 da.

Zergatik da hau horrela?

Antza denez, bi probintzietako elementuak talde berean elkartu eta subjektu-kopurua bikoiztu egindelako. Honek diferentzien errore estandarra gutxitzea eragiten du; era berean, konfiantza-tarteen luzeratxikitzea eragiten du.

Bi talde baino gehiagoko batezbestekoen arteko konparaketarekin jarraituko dugu, baina kasu hone-tan proba ez-parametrikoetara pasako gara. Eta hauetatik, 3 lagin edo talde askeren, edo gehiagoren,kasuan erabiliena hautatuko dugu: Kruskal-Wallisen H proba.

9.5. PROBA EZ-PARAMETRIKOA: KRUSKAL WALLISEN H PROBA

Zenbaitetan, bariantzaren analisiarekin lan egiteko aplikazio-baldintzak ez dira betetzen, erroreak aske-ak ez direlako edo datuek sailkapen normalari jarraitzen ez zaizkiolako edo, besterik gabe, oso datu gutxiditugulako. Kasu hauetan, aukera baliagarria proba EZ-PARAMETRIKOETAN aurkituko dugu, eta hauenartean, 3 lagin edo gehiagoren batezbestekoa konparatzeko, Kruskal Wallis-en proba daukagu.

Hasierako hipotesia hau da: gure lagin/taldeko batezbestekoak, batezbesteko berdinak dituzten popu-lazioetatik datoz.

Aplikatu ahal izateko aldagaia, gutxienez, eskala ordinal batean neurtu ahal izango dugu.

Kalkulu-prozesu orokorra, lagineko datu guztiak oinarrizko ordena bakar baten arabera ordenatzeandatza. Eta probaren funtsa lagin bakoitzaren datuen ordenatako batezbestekoak konparatzean datza.Laginetako batezbestekoak berdinak badira, talde bakoitzari dagozkion subjektuen ordenetako batezbes-tekoak ere berdinak direla pentsatzen da. Hipotesi nuluak, ordenen batezbestekoen artean sortzen direndiferentzia txikiak zorizkoak direla pentsatuko dugu. Behatutako batezbestekoak batezbesteko teorikoe-kin konparatuko ditugu, eta diferentzia hauek zoriaren ondorio izan daitezkeenaren probabilitatea kalku-latuko dugu. Horretarako Kruskalen H estatistikoarekin lan egingo dugu, modu honetan definitua:

12 k R2 jH = –––––––––– Σ ––––––––– –3 (N+1)

N (N+1) j=1 Nj

Bertan K: talde-kopurua da.Nj:j taldeko subjektu-kopurua da.Rj: j taldeko subjektuen heinen batura da.N: subjektu-kopuru totala da.

H estatistikoa ji karratuaren arabera sailkatzen dela ikus daiteke, K-1 askatasun-graduarekin.

293Bi talde baino gehiagoren batezbestekoen konparaketa

Page 306: Estatistika teoria eta praktika SPSSWIN erabiliz

Probaren oinarri teorikoen sarrera labur hau ikusi ondoren, ikus ditzagun proba honen emaitzak lortuahal izateko eman beharreko pausoak eta hauek interpretatzeko arauak.

Gai honetako lehen adibideko datuekin lan egingo dugu. Gogora dezagun 3 ikastetxeetako 15 ikasle-ren MATEMATI-ko notak genituela. Hauexek ziren datuak:

IKASTETXEA Ikasleen emaitzak -X

AAAAA 84 97 87 85 77 86

BBBBB 161 163 169 176 151 164

DDDDD 121 111 116 121 111 116

Datuak oso dira errazak, eta horregatik jartzen ditut, hain zuzen ere, adibide gisa. Gaiaren hasierantekleatu dituzu jada, baina mantendu ez badituzu eta berriro tekleatu nahi ez badituzu, hitzaurrean aipa-tutako Web orrialdean dagoen ANOVA.SAV fitxategian dituzu. Zabal ezazu, eta emaitzak lortu ahal iza-teko eman behar dituzun pausoak hauek dira:

EstadísticosPruebas no paramétricas

K muestras independientes

Eta leiho hau edukiko duzu, Contrastar Variables-en MATEMATI aldagaia, eta Variable de Agrupaciónbezala IKASTETX hartu ditut bertan. IKASTETX izenaren atzean galdera-ikur batzuk azaltzen zaizkit.Aldagaiaren minimo eta maximoen balio edo heinak zehazteko eskatzen ari zait. Horretarako, aurrekokasuetan bezalaxe, Definir rango sakatu eta leiho berrian Mínimon 1 eta Máximon 3 idatziko dut.Continuar.

Tipo de prueba gisa defektuz azaltzen dena utziko dut: Kruskal-Wallisen H, Aceptar.

294

Page 307: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitzak hauek dira:

SPSSWIN 6.1.3

- - - - - Kruskal-Wallis 1-Way Anova

MATEMATI

by IKASTETX

Mean Rank Cases

3,00 5 IKASTETX = 1 aaaaa

13,00 5 IKASTETX = 2 bbbbb

8,00 5 IKASTETX = 3 ddddd

-—

15 Total

Chi-Square D.F. Significance

12,5448 2 ,0019

7.5 bertsioan...

SPSSWIN 7.5

Pruebas no paramétricas

Prueba de Kruskal-Wallis

Datuen interpretazioa, bi bertsioetan, oso erraza da. Lehenik, aurrez globalean ordenatuak izan direntalde bakoitzeko elementuen ordenen batezbestekoa aurkezten digu. 1 taldeko 5 elementuen ordenenbatezbestekoa 3 da, (5 puntuazio txikiena izanik, bere ordenak hauek ziren: 1, 2, 3, 4 eta 5), 2 taldearenpuntuazioen batezbestekoa: 13. 5 puntuazio handienak dira: 11tik 15erako ordenak, eta 3 taldearen pun-tuazioen batezbestekoa: 8. Bere ordenak 6tik 10era dira.

Betiko galdera. Zenbateraino izan daitezke emaitza hauek zoriz lortuak? Edo, benetan batezbesteko-ak desberdinak dira? Horretarako H estatistikoa lortu du, H: 12.545; askatasun-graduak 3 dira (talde--kopurua -1), eta emaitza hauek, diferentzia hauek, zorizkoak izateko probabilitatea: 0.002. Beraz,0.002ko errore-tartearekin, hiru ikastetxeetako emaitzak ezberdinak direla ondorioztatuko dut.

Komeni da, froga hau bera, baina bariantzaren analisiaren bitartez, gaiaren hasieran egin dudala gogo-ratzea. Han, emaitza hauek zoriz lortzeko probabilitatea 0.0000 izan da. H proba kontserbatzaileagoa,eta datu hauentzako egokiagoa, dela ikusten dugu, bariantzaren analisia hain subjektu gutxirekin egiteaez baita egokiena.

Aurrera egin eta arazoa zerbait gehiago konplikatuko dugu. 2 FAKTOREKO bariantzaren analisiarenadibide-pare batekin lan egingo dugu.

295Bi talde baino gehiagoren batezbestekoen konparaketa

Rangos

IKASTETX NRango

promedio

aaaaabbbbbdddddTotal

MATEMATI 555

15

3,0013,00

8,00

Estadísticos de contraste a,b

MATEMATI

Chi-cuadradoglSig. asintót.

12,5452

,002

a. Prueba de Kruskal-Wallisb. Variable de agrupación: IKASTETX

Page 308: Estatistika teoria eta praktika SPSSWIN erabiliz

9.6. 2 FAKTOREKO BARIANTZAREN ANALISIA

Faktore bakar bateko bi talde edo lagin baino gehiagoren batezbestekoen konparaketa orokortuko dugu.Gogora dezagun, faktore bat, gure datu-multzoa, faktore horren kategoria edo mailen arabera, azpilaginezberdinetan zatitzeko erabiltzen dugun aldagai koalitatibo bat dela. Orain arte MATEMATIren emaitzakprobintzia ezberdinetan konparatu izan ditugu, baina emaitza horiek berak, ikastetxea publikoa ala pri-batua den kontuan izanik konparatzeko beharra izan dezakegu. Hau da, orain arte, taldeen batezbeste-koen konparaketak sailkapen-irizpide edo faktore bakar baten arabera egin izan ditugu. Hemendik aurre-ra sailkapen-irizpide edo faktore bat baino gehiagorekin egingo dugu. Konparatuko ditugu, adibidez, nes-ken eta mutilen emaitzak baina ez orokorrean bakarrik, ikastetxe publiko edo pribatura doazen kontuanizanik.

Testuinguru honetan diseinu faktorialaz ari gara, bertan ELKARREKINTZA izenekoak kontuan izangoditugularik. Demagun gizon eta emakumeengan hiru pastila-motek duten eragina konparatzen ari garela:Aspirina, Bespirina eta Despirina.

Demagun emaitzen laburpen-taula hau lortu dugula:

ASPIRINA BESPIRINA DESPIRINA

gizonak 15 17.1 15.9 16

emakumeak 17 15.1 15.9 16

16 16.1 15.9

Orokorrean aztertuta, hiru pastila-moten eraginkortasuna oso antzekoa dela esan dezakegu, diferen-tziak txikiak baitira. Gizonezkoengan duen eragina emakumezkoengan duenaren antzekoa dela ere esandezakegu. Baina... bi aldagaiak (faktoreak) gurutzatzean, pastila-mota eta sexua, eta eraginkortasuna kon-paratzean, Aspirina emakumeentzat eta Bespirina gizonezkoentzat direla onenak eta Despirinak gizo-nezko nahiz emakumezkoentzat tarteko eraginkortasuna duela ikusten dugu. Honi ELKARREKINTZA deri-tzo. Faktore bat baino gehiagoko bariantzaren analisian hau da antzeman edo detektatu nahi izangodugun emaitza diferentziala. Hemen sailkapen-irizpide edo faktore biko adibide bat aurkeztu dut, bainabi baino faktore gehiagora oso erraz orokortu ahal izango dut. Adibidez, ikerketa hau bera erraz zabaldezaket aztergai diren pertsonen adin desberdinak, edo osasun-egoera ezberdinak, edo arrisku-portaeraezberdinak,... etab. kontuan izanik.

Eta lan-aukerak zertxobait gehiago osatuko ditut beste adibide batekin.

Demagun probintzia ezberdinetan matematikako emaitzak aztertzen ari naizela, ikastetxeak pribatuakala publikoak diren ere kontuan izanik. Baina badakit matematikako emaitzek, RAVEN testarekin neurtududan adimenarekin erlazioa duela. Matematikako emaitza ezberdinak probintziaren eta ikastetxepubliko-pribaturen arabera aztertu nahi ditut, baina RAVEN aldagaiak, matematikaren errendimenduanizan ditzakeen eraginak zuzenduz. Bere eraginak zuzendu nahi dizkiodan aldagai honi “COVARIABLE”deritzo. SPSSWINek ere, mota honetako erlazioak aztertzen utziko digu. ANOVA ereduaren barneanSPSSWINek eskainitakoen artean aukera gehiago ere badira, baina testu liburu honen helburuetatik kanpogeratzen direnez, hemen, azaldutako kasuak bakarrik jorratuko ditut.

Kasu guztietan eredu eta oinarri teorikoa bera da. Menpeko aldagaiak sortutako aldaketak aztertzeandatza gakoa, baita faktoreek modu askean, modu gurutzatuan (elkarrekintzan), edo kobariableen lagun-tzaz zenbateraino azal ditzaketen ere. Horretarako taldeen barneko, arteko... eta distantzia guztiak, gaia-ren hasieran ikusi dugun eskema jarraituko dute. Hauxe izango da SPSSk jarraituko duen eskema ere,emaitzak aurkezteko.

296

Page 309: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitzak lortzeko, LIBURU.SAV datu-fitxategia kargatu ondoren, pauso hauek eman behar dira:

EstadísticosModelo lineal general

Factorial Simple

Eta honen antzeko leiho bat lortuko dut, hainbestez bide erdia egin dugularik:

Dependiente-n Matemati idatzi dugu, Factor(es)-en Probintz eta Pubpriba izenak hartu ditugu. Bainafaktoreetako bakoitza hartzean, aldagaiaren izenaren atzean bi galdera-ikur azaltzen zaizkigu. Analisiaegiteko kategorien balio handiena (maximoa) eta txikienak (minimoa) zein diren adierazi beharko diogu.Faktore bat hautatu ondoreneko prozesua hau da: Probintz, Definir rango... botoia sakatu eta 1 eta 4idazten dut Mínimo eta Máximon, hurrenez hurren. Berdina Pubpriva-rekin, definir rango, 1 eta 2.Continuar. Opciones-en método bezala Jérarquico hautatzen dut, Estadísticos bezala Medias y tamaños;Ver etiquetas eragiten dut eta, interacciones máximas bezala dobles hautatzen dut. Continuar.

Kobariableak hurrengo adibiderako utziko ditut; adibide honetan zurian geratzen dira. Aceptar.

Emaitzak hauek dira:

SPSSWIN 6.1.3

* * * C E L L M E A N S * * *

MATEMATI

by PROBINTZ

PUBPRIBA

Total Population

23,89

( 329

PROBINTZ

1 2 3 4

23,73 23,32 26,24 21,82

( 92) ( 77) ( 88) ( 72)

297Bi talde baino gehiagoren batezbestekoen konparaketa

Page 310: Estatistika teoria eta praktika SPSSWIN erabiliz

PUBPRIBA

1 2

23,90 23,87

( 192) ( 137)

PUBPRIBA

1 2

PROBINTZ

1 23,73 ,00

( 92) ( 0)

2 22,91 23,50

( 23) ( 54)

3 25,15 27,97

( 54) ( 34)

4 22,65 21,43

( 23) ( 49)

* * * A N A L Y S I S O F V A R I A N C E * * *

MATEMATI

by PROBINTZ

PUBPRIBA

HIERARCHICAL sums of squares

Covariates entered FIRST

Sum of Mean Sig

Source of Variation Squares DF Square F of F

Main Effects 867,089 4 216,772 10,585 ,000

PROBINTZ 821,108 3 273,703 13,364 ,000

PUBPRIBA 45,981 1 45,981 2,245 ,135

2-Way Interactions 149,214 2 74,607 3,643 ,027

PROBINTZ PUBPRIBA 149,214 2 74,607 3,643 ,027

Explained 1016,304 6 169,384 8,271 ,000

Residual 6594,535 322 20,480

Total 7610,839 328 23,204

335 cases were processed.

6 cases (1,8 pct) were missing.

298

Page 311: Estatistika teoria eta praktika SPSSWIN erabiliz

7.5 bertsioan...

SPSSWIN 7.5

ANOVA

Bi bertsioetako emaitzak, aurkezpenari dagokionez, zertxobait aldatzen direla ikusten dugu, bainafuntsezko ezer ez da aldatzen. Ikus ditzagun oinarrizko balioak. Emaitzak bi zatitan banatuta daude; lehe-nengoan, lortutako talde bakoitzaren deskribapena aurkezten digu, lehenbizi modu askean faktoreetakobakoitzarekin, eta bigarrenean bi faktoreak gurutzatzean osatzen diren taldeetan.

Kasu bakoitzarentzat taldearen batezbestekoaren balioa eta honen subjektu-kopuruarena aurkeztendizkigu.

299Bi talde baino gehiagoren batezbestekoen konparaketa

Resumen del procesamiento de los casosa

Casos

Incluidos Excluidos Total

N Porcentaje N Porcentaje N Porcentaje

329 98,2 % 6 1,8 % 335 100,0

a. MATEMATI por PROBINTZ,

Medias de las casillas b

BIZKAIA PUBLIKOAPRIBATUATotal

23,73

23,73

920

92

NAFARROA PUBLIKOAPRIBATUATotal

22,9123,5023,32

235477

ARABA PUBLIKOAPRIBATUATotal

25,1527,9726,24

543488

GIPUZKOA PUBLIKOAPRIBATUATotal

22,6521,4321,82

234972

Total PUBLIKOAPRIBATUATotal

23,9023,8723,89a

192137329

PROBINTZ PUBPRIBA Media N

MATEMATI

a. Media globalb. MATEMATI por PROBINTZ,

MATEMATI Efectosprincipales

Interacciones de orden2

ModeloResidualTotal

(Combinadas)PROBINTZPUBPRIBAPROBINTZ*PUBPRIBA

867,089821,108

45,981149,214

1016,3046504,5357610,839

Suma decuadrados

4312

6322328

216,772273.703

45,98174,607

169,38420,48023,204

10,58513,364

2,2453,643

8,271

,000,000,135,027

,000

glMedia

cuadráticaF Sig

Método jerárquico

ANOVAa

a. MATEMATI por PROBINTZ, PUBPRIBA

Page 312: Estatistika teoria eta praktika SPSSWIN erabiliz

Arabako emaitzak (3 balioa) direla altuenak ikusten dugu: 26.24, eta jarraian Bizkaia, Nafarroa etaGipuzkoa. Pubpribak sortzen dituen taldeetan, batezbestekoek ia bat egiten dute. Ikus dezagun astiroagoanalisi honen alderdi diferentziala: elkarrekintza.

9.6.1. Elkarrekintza

Galdera hau da: modu askean faktore bakoitzagatik sortutako taldeen artean ematen diren diferentziakmantentzen al dira bi faktoreak gurutzatzen direnean sortzen diren taldeetan?

Konparaketa orokorrak adierazten duen bezala, ikastetxe pribatu eta publikoetako emaitzak ia betiberdinak al dira? Erantzuna ezezkoa da. Fija gaitezen, adibidez, 3 eta 4 probintzien gurutzaketaren emai-tzetan. Diferentzien zeinua, hain zuzen, kontrajarria da. 3. probintzian, Araban, ikastetxe pribatuek publi-koek baino emaitza hobeak dituzte, 4. probintzian, Gipuzkoan, publikoek pribatuek baino emaitza hobe-ak lortzen dituzten bitartean.

Orain azterketa guztietan egiten ari garen galdera iristen da, diferentziak izan al litezke? Galdera hauerantzun aurretik, kasu honetan, hiru motako diferentziak ditugula gogoan izan behar dugu: bat, probin-tzia ezberdinetako diferentziak; bi, ikastetxe publiko eta pribatuetakoak, eta hiru, bi faktoreak gurutza-tzean ematen direnak. Ikus dezagun galdera hauetako bakoitzaren erantzuna non topatzen dugun.

Hurrengo taulan bariantzaren analisiaren emaitzak aurkezten dizkigu. Menpeko aldagaiaren barian-tza, MATEMATI, hiru zatitan deskonposatzen da: modu linealean adierazitako zatia (867.089), elkarre-kintzak adierazitakoa (149.214), eta hondar-bariantza (6595.535). Guztien batura 7610.839 da eta batu-ra hau Matemati aldagaiaren distantziaren karratua da.

Era berean, modu linealean adierazitako zatia Probintz aldagaiagatik (821.108) eta Pubpriba alda-gaiagatik (45.981) adierazitakoetan deskonposatzen da. Modu linealean adieraziak gehi interakzioagatikadieraziak, adierazitako bariantzaren totala ematen dute.

Bariantzetako bakoitza zoriak eragindakoa izateko probabilitatea zein den galderari erantzuteko, pro-babilitateak SIG of F zutabean azaltzen zaizkidanak direla esango dizut. Diferentzia-mota bakoitza zorizemateko probabilitateak hauek dira:

Probintzietan ematen direnak: PROBINTZ: .000Publiko eta pribatuetan ematen direnak: PUBPRIBA: .135Interakzioaren ondorio direnak: .027

Aurrekoaren arabera gure ondorioak probintzia ezberdinen artean ematen diren diferentziak zoriarenondorio ez direla ondorioztatzea izango da 0.000ko errore-tartearekin; elkarrekintzarenak ere ez,0.027ko errore-tartearekin, baina ezingo dut gauza bera esan Pubpriva ikastetxe motari dagozkieneiburuz, hauen errore-tartea handiegia izango bailitzateke: 0.135. Beraz, nire ondorioak hauek izango dira:probintzitako batezbestekoak desberdinak dira, pribatu eta publikokoak bezalaxe, eta bi faktoreen guru-tzaketatik sortzen diren taldeenak ere desberdinak dira. Hau guztia % 5eko errore-tartearekin.

Elkarrekintzari buruzko azken aipamen bat egin behar genuke. 0.027ko errore-tartearekin, elkarrekin-tza badagoela erabakitzen dugu. Eta orain zer? Galdera hau erantzun ahal izateko analisia xehetasunezazaldu, eta beraien artean diferentziak esanguratsuak diren talde-pareak zein diren frogatu behar genuke.Analisiak, lortzen ditugun emaitzetara egokituz joan beharko luke. Saia zaitez.

Nik bigarren adibidearekin jarraituko dut.

Kasu honetan ikastetxe publiko eta pribatuetan (PUBPRIBA) gizon eta emakumeek (SEXUA)MATEMATI-ko frogan ateratzen dituzten emaitza ezberdinak aztertu nahi ditugu. Baina RAVENeko pun-tuazioek MATEMATI-ko emaitzekin erlazionatuak egon litezkeela, eragina izan dezaketela edota emai-tzak baldintza ditzaketela pentsatzen dugunez, eragin hori deusezten saiatuko naiz. HorretarakoCovariable(s)-en artean RAVEN aldagaia hartuko dut.

300

Page 313: Estatistika teoria eta praktika SPSSWIN erabiliz

301Bi talde baino gehiagoren batezbestekoen konparaketa

Eman beharreko pausoak:

EstadísticaModelo lineal general

Factorial Simple

Eta honen antzeko leiho bat lortuko dut eta aldagai guztiak bakoitza bere lekuan kokatuko ditut. Bifaktoreen heinak ere definitu ditut. Ohar zaitez kobariable bezala RAVEN aldagaia hartu dudala.

Emaitzak hauek dira:

SPSSWIN 6.1.3

* * * C E L L M E A N S * * *

MATEMATI

by PUBPRIBA

SEXUA

Total Population

23,96

( 294)

PUBPRIBA

1 2

24,02 23,89

( 163) ( 131)

SEXUA

1 2

23,90 24,00

( 120) ( 174)

Page 314: Estatistika teoria eta praktika SPSSWIN erabiliz

Resumen del procesamiento de los casosa

Casos

Incluidos Excluidos Total

N Porcentaje N Porcentaje N Porcentaje

294 87,8 % 41 12,2 % 335 100,0

a. MATEMATI por PUBPRIBA, SEXUA con RAVEN

SEXUA

1 2

PUBPRIBA

1 24,60 23,52

( 75) ( 88)

2 22,73 24,49

( 45) ( 86)

* * * A N A L Y S I S O F V A R I A N C E * * *

MATEMATI

by PUBPRIBA

SEXUA

with RAVEN

HIERARCHICAL sums of squares

Covariates entered FIRST

Sum of Mean Sig

Source of Variation Squares DF Square F of F

Covariates 1659,036 1 1659,036 98,970 ,000

RAVEN 1659,036 1 1659,036 98,970 ,000

Main Effects 18,547 2 9,273 ,553 ,576

PUBPRIBA 18,117 1 18,117 1,081 ,299

SEXUA ,430 1 ,430 ,026 ,873

2-Way Interactions 59,397 1 59,397 3,543 ,061

PUBPRIBA SEXUA 59,397 1 59,397 3,543 ,061

Explained 1736,979 4 434,245 25,905 ,00

Residual 4844,531 289 6,763

Tota 6581,510 293 22,462

335 cases were processed.

41 cases (12,2 pct) were missing.

7.5 bertsioan:

SPSSWIN 7.5

ANOVA

302

Page 315: Estatistika teoria eta praktika SPSSWIN erabiliz

Emaitzak aztertzeko garaian, aurreko adibidean aztertutakoaz gain, zer esan gutxi dago. Kasu horre-tan bezala, 7.5 bertsioa kasu onargarrien portzentaiaren eta kopuruaren, eta galdutako kasuen edo alda-gairen baten balioa ezagutzen ez dugun kasuen kopuruaren aurkezpenarekin hasten da. 6.1.3 bertsioan,datu hauek, emaitzen amaieran aurkezten ditu.

Ondoren, 7.5 bertsioan, MATEMATI aldagaiaren emaitzen konparaketa-taula daukagu, SEXU eta PUB-PRIBA faktoreek sortzen dizkidaten taldeetako bakoitzean. Diferentziak minimoak direla ikusten dugu.Aldiz bi faktoreak gurutzatzean sortzen diren lau taldeetako diferentziak ia “liburukoak” dira. Hau el-karrekintzaren ohizko adibide bat da. Ohar zaitez nola PUBPRIBA =1, ikastetxe publikoan, gizonek(SEXUA = 1) emakumeek baino emaitza hobeak dituzten (gizonek 24.60 eta emakumeek 23.52), aldizikastetxe pribatuetan (PUBPRIBA =2) emakumeen emaitzak gizonezkoenak baino hobeak dira (gizonek22.73 eta emakumeek 24.49).

Diferentzia hauek MATEMATI aldagaiaren emaitzen batezbestekoak talde ezberdinetan aztertuz ikusiditugu. Baina... betiko galdera sortzen da, zenbateraino izan daitezke diferentziak zoriz lortuak?Diferentziak aztertzeko garaian hiru maila daude. Edo berdina dena, diferentzi motetako bakoitza zorizemateko probabilitateak, kasu honetan:

PUBPRIBA-n ematen direnak: Sig = .299SEXUA-ren arabera ematen direnak: Sig = .873Elkarrekintzaren ondorio direnak: Sig = .061

303Bi talde baino gehiagoren batezbestekoen konparaketa

Medias de las casillas b

PUBLIKOA GIZONAEMAKUMEATotal

24,6023,5224,02

7588

163

PRIBATUA GIZONAEMAKUMEATotal

22,7324,4923,89

4586

131

Total GIZONAEMAKUMEATotal

23,9024,0023,96a

120174294

PUBPRIBA SEXUA Media N

MATEMATI

a. Media globalb. MATEMATI por PUBPRIBA, SEXUA

MATEMATI CovariablesEfectosprincipales

Interacciones de orden2

ModeloResidualTotal

RAVEN(Combinadas)PUBPRIBASEXUAPUBPRIBA*SEXUA

1659,0318,5418,11,430

59,39

1736,974844,536581,51

Suma decuadrados

1211

1

4289293

1659,039,27318,11,430

59,39

434,2416,7622,46

98,97,553

1,081,026

3,543

25,90

,000,576,299,873

,061

,000

glMedia

cuadráticaF Sig

Método jerárquico

ANOVAa,B

a. MATEMATI por PUBPRIBA, SEXUA con RAVENb. Las covariables introducidas primero

Page 316: Estatistika teoria eta praktika SPSSWIN erabiliz

304

Printzipioz, talde hauetan lortu ditugun diferentzia guztiak, zoriaren ondorio izan zitezkeela ikustendugu, edo beste modu batera esanda, diferentziak zoriz direla erabakitzen badut, errore-tartearen neurria,hipotesi nulua ez alboratzeko adinakoa da. Batezbestekoak berdinak direla esanaz amaituko dut, edohobeto esanda, datu hauetatik aurrera % 5eko errore-tartearekin desberdinak direnik ezin dut ondorioz-tatu.

Baina elkarrekintza zer den ikusteko baliagarria suertatu zaigu.

Gai hau amaitzeko azken xehetasun bat geratzen zaigu: kobariantzaren gaia. Analisi hau, RAVEN adi-men aldagaiak MATEMATI-ren puntuazioan duen eragina deuseztuz egin dugu.

Emaitzetan, bariantzaren analisiaren taulan, RAVEN aldagaiak MATEMATI aldagaitik jartzen dituenerlazio edota azalpeneko emaitzak azaltzen dizkigu. Alderdi esanguratsu bat azaltzen du: F = 98.970, etazorizkoa izateko probabilitatea 0.000 da.

Emaitza hau ikusita, azterketan gehiago sakontzea egokia da, berau kobariablearen eraginak deusez-tu gabe burutzea. Egiten baduzu kasu horretan elkarrekintza esanguratsua dela: 0.016, eta adierazgarri-tasunaren gainerantzeko balioak ere aldatzen direla ikusiko duzu. Egin ezazu proba.

Nik gaia hemen amaitzen dut eta Gizarte Zientziei Aplikatutako Estadistikaren metodo ezagun eta era-bilienetako bat garatzera joko dut: Erregresioa.

Page 317: Estatistika teoria eta praktika SPSSWIN erabiliz

10. ERREGRESIO ANIZKOITZA

10.1. ERREGRESIO ANIZKOITZAREN ANALISIA

10.2. BARIANTZA-ANALISIAREKIN ERLAZIOA

10.3. ERREGRESIO SINPLEA SPSSWIN ERABILIZ

10.4. ERREGRESIO ANIZKOITZA

10.5. KORRELAZIO-KOEFIZIENTE ANIZKOITZA

10.5.1. Aldagai askeen aukeraketa. Ekuazioa osatzeko metodoak

10.5.2. Erregresioa aplikatzeko baldintza

10.6. ERREGRESIO ANIZKOITZA ETA SPSSWIN: ADIBIDE OROKORRA

10.6.1. 6.1.3. bertsioko emaitzak

10.6.2. 7.5. bertsioko emaitzak

Page 318: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 319: Estatistika teoria eta praktika SPSSWIN erabiliz

10. ERREGRESIO ANIZKOITZA

Ikerketa enpirikoetan gehien erabilitako metodoen artean, behar bada ezagunena, erregresio-metodoa da.Metodo honen helburua hau da: bi datu-multzo edo gehiago edukiz, lehenengo pausoan, euren arteanerlazionatuta dauden ala ez jakitea da, eta baiezko kasuan erlazio hau koantifikatu eta nolakoa den azter-tzea.

Metodo hau erabiltzeko, aztertu nahi ditugun aldagaiek koantitatiboak izan behar dute. Hala ere,batzuetan, aldagai dikotomizatuak ere erabiltzen dira.

Analisi honetan aldagaiak bi sailetan banatuko ditugu. Alde batetik, menpeko aldagaia edo depen-dentea dago, aztertu nahi duguna. Beste aldean geldituko lirateke gainerako aldagaiak, aske edo inde-pendente deituak. Esan beharra dago erregresio-analisian, menpeko aldagaien aldaketak aztertzen direla,baina aldagai askeen aldaketetan oinarrituz. Aldagai askea bakarra denean, erregresioa sinplea izango da.Ostera, aldagai askeak bi edo gehiago direnean, erregresio anizkoitza izango da. Guk aztertuko ditugunkasuetan, menpeko aldagaia beti bakarra izango da.

Korrelazioaren eta erregresioen arteko ezberdintasun nagusiena hau da: korrelazioaren kasuan ez daposible aldagai baten aldaketak besteen aldaketen arabera sortzen direla esatea, hau da, ez da posibleizango kausalitateaz hitz egitea. Ostera, erregresioaren kasuan bai; aldagai bat (menpekoa) ondoriozkoaizango da, eta besteak (askeak) zergatiak edo kausalak.

Erregresio-analisiak, batez ere lau helburu hauek beteko ditu:

1.- Aldagaien arteko harremanak aztertzea.

2.- Aldagaien arteko erlazioa hobeto aztertu edo esplikatzen duen funtzio matematikoaren-mota era-bakitzea.

3.- Funtzio matematikoa zein eratakoa den jakin ondoren funtzio honen parametroak kalkulatzea.

4.- Menpeko aldagaiaren aurresanak, aldagai askeekiko egitea.

Gai honetan aldagaien arteko erlazioak linealak direla suposatuko dugu. Hau da, gure lagineko hodei--puntura gehien hurbiltzen den funtzio matematikoa, lineala dela onartuko dugu, oinarrizko hipotesibezala. Beraz aipatutako 2. puntua ez dugu aztertuko. Hala ere, esan beharra dago, aldagaien arteko erla-zioa lerromakurra denean eman behar diren pausoak berdinak direla.

Gai hau, 3. kapituluan ikusi dugunaren osagarria da eta jada 3. gaia irakurria duzuela pentsatuko dut.Hala ere, lehen ikusitako kontzeptu batzuk berrikustera behartuta gaude.

10.1. ERREGRESIO ANIZKOITZAREN ANALISIA

Metodo honen oinarriak aztertzeko adibide sinple bat erabiliko dugu.

Demagun, 10 ikasleri ondorengo 4 aldagaiak neurtu dizkiegula:

Y : Frustrazio-maila: FRUSTRAZ.

X1 : Telebistaren aurrean astean zehar emandako orduak: TELEBIS1.

X2 : Antsietate-maila. ANTSIETA.

X3 : Maila sozioekonomikoa. MAILASOZ.

Gure helburua izango da, FRUSTRAZ aldagaiko (menpeko aldagaia) aldaketak TELEBIS1, ANTSIETAeta MAILASOZ aldagaietako (aldagai independente edo askeak) aldaketetan oinarrituz, ulertzen edoesplikatzen saiatzea.

307

Page 320: Estatistika teoria eta praktika SPSSWIN erabiliz

Demagun lortu dugun datu-matrizea hau dela:

Y X1 X2 X3

80 24 75 3

73 20 64 3

84 31 81 2

40 12 39 4

47 17 50 2

56 16 60 2

54 9 47 4

90 32 83 1

70 13 60 4

43 19 40 2

Σ = 637 Σ = 193 Σ = 599 Σ = 27

Logikoa dirudi Y aldagaia (FRUSTRAZ), beste aldagaiekin erlazionatuta dagoela pentsatzeak. Aldagaihauen arteko harremanak aztertzeko korrelazio-matrizea kalkulatuko dugu.

Aurrera jarraitu baino lehen, guk honako galdera hau plantea dezakegu: X1, X2 eta X3 aldagaien bali-oak aldatzen direnean, zein eratako aldaketak gertatzen dira Y aldagaian? Y aldagaiaren balioa ezagutual dezakegu, X1, X2 eta X3 aldagaien balioak ezagutuz? Bi galdera hauen erantzunak erregresio-analisienbidez lortuko ditugu.

Aurreko adibidea aztertuko dugu kalkulu guztiak eskuz eginez; gero, emaitza hauek SPSSWIN erabi-liz lortzeko eman behar diren pausoak ikusiko ditugu. Eta azkenik, SPSSWIN paketeak ematen dizkigunemaitzak aztertuko ditugu.

Erregresio lineal sinpleko kalkuluak eskuz eginez emango diegu hasiera.

Lehenengo, ondorengo kalkulu guztiak egin behar ditugu:

Y X1 X2 X3 Y2 X12 X22 X32 YX1 YX2 YX3 X1X2 X1X3 X2X3

80 24 75 3 6400 576 5625 9 1920 6000 240 1800 72 225

73 20 64 3 5329 400 4096 9 1460 4672 219 1280 60 192

84 31 81 2 7056 961 6561 4 2604 6804 168 2511 62 162

40 12 39 4 1600 144 1521 16 480 1560 160 468 48 156

47 17 50 2 2209 289 2500 4 799 2350 94 850 34 100

56 16 60 2 3136 256 3600 4 896 3360 112 960 32 120

54 9 47 4 2916 81 2209 16 486 2538 216 423 36 188

90 32 83 1 8100 1024 6889 1 2880 7470 90 2656 32 83

70 13 60 43 4900 169 3600 16 910 4200 280 780 52 240

43 19 40 2 1849 361 1600 4 817 1720 86 760 38 80

Σ = 637 599 43495 38201 13252 1665 466

Σ= 193 27 4261 83 40674 12488 1546

-Y = 63.7 -X1 = 19.3 -X2 =59.9 -X3 =2.7

S2y =324.33 S2x1 = 59.567 S2x2 = 257.878 S2x3 = 1.122

308

Page 321: Estatistika teoria eta praktika SPSSWIN erabiliz

Hemen lortu ditugun emaitzak, gero erabiliko ditugu. Kontuan eduki behar dugu, aurkeztutako lagi-neko bariantzaren balioak lagineko kuasibariantzarenak direla, SPSSWIN paketeak balio hauek erabiltzenbaititu estimatzaile bezala. Arrazoia zera da: estimatzaile hau alboragabea dela.

Demagun frustazio-maila neurtzen duen aldagaia (FRUSTRAZ), telebista aurrean (TELEBIS1) pasatakoorduen arabera nola aldatzen den aztertu nahi dugula. Lehenengo pausoan korrelazio-koefizientea kal-kulatuko dugu. Kasu honetan, Pearson-en formula aplikaturik, honako hau lortzen dugu:

N Σ (YX1) – Σ (Y) Σ (X1) Ryx1 = ––––––––––––––––––––––––––––––

√NΣ (Y)2 – (ΣY)2 �√Σ(X1)2 – (ΣX1)2

10 * 13252 - 637 * 193 9579Ryx1 = ––––––––––––––––––––––––––––––––– = ––––––––– = .7659

√10*43495 – 6372 �√10*4261 – 1932 12507

Aldagai biak, positiboki eta neurri handi batean, erlazionatuta daudela ohartzen gara. Hala ere, alda-gai bien arteko erlazioa handia edo txikia den erabakitzeko, edo beste era batera esanda erlazio haukoantifikatzeko, erregresio-analisian DETERMINAZIO edo MUGATZE-KOEFIZIENTEA erabiltzen da.Honen balioa korrelazio-koefizientearen karratua eginez kalkulatzen da. Gure kasuan:

DETERMINAZIO-KOEFIZIENTEA: R2 = .76592 = .5866

Determinazio-koefizientea honela defini dezakegu: “Menpeko edo aldagai dependentearen barian-tzaren proportzioa, aldagai aske edo independentetik eratorria dena”.

Gure kasuan, FRUSTRAZ aldagaian jasandako aldaketak, % 58.66an TELEBIS1 aldagaiaren eraginezizan direla baiezta dezakegu. Aldakortasun honen azalpena honela eman dezakegu: aldagai dependen-tearen bariantzaren % 58.66, aldagai independenteen bariantzan oinarrituak daude.

Korrelazio-koefiziente guztietan zati bat zoriari dagokio, hau da, inolako erlaziorik gabeko aldagaiakdatu-multzo batean aztertzen baditugu, zoriaren ondorioz, aldagaien arteko korrelazio-koefizientea ez da0 izango, balio honetatik oso hurbil egon arren. Hau zuzentzeko, SPSSWIN paketeak, determinazio-koefi-zienteekin batera, DETERMINAZIO-KOEFIZIENTE ZUZENDUA aurkezten du. Balio berri hau kalkulatze-ko ondoko formula erabil dezakegu:

k (1 – R2)R2z = R2 –––––––––––––

N – k –1

non : k erabilitako aldagai askeen kopurua denN pertsona edo elementu-kopurua denR2z zuzendutako determinazio-koefizientea den

Gure kasuan:

1 (1 – .58662)R2z = .5866 – –––––––––––––– = .5349

10 – 1 –1

Zuzendutako koefizientean, aurreko interpretazioa doitu egin beharko genuke: determinazio--koefizientea % 58.66tik % 53.49ra jaitsiz errealitateari gehiago egokitzen zaiola esan genezake.

Hurrengo pausoa, FRUSTRAZ aldagaian espero diren balioak aurresatea izango litzateke. Demagunhaur batek astean zehar telebista aurrean 20 ordu pasatzen dituela. Haur honengan FRUSTRAZ aldagaiakduen balioa aurresateko, erregresio zuzena honela erabil dezakegu.

309Erregresio anizkoitza

Page 322: Estatistika teoria eta praktika SPSSWIN erabiliz

Aldagai independenteari buruz hitz egiten dugunean, erregresio zuzenaren oinarria hau da: matrizea-ren datu-bikote bakoitza, planoan puntu bat da (X,Y). Erregresio zuzena kalkulatzea, planoan jarritakopuntu-multzora gehien hurbiltzen den zuzenaren ekuazioa kalkulatzea izango da.

Erregresio zuzena, hau da puntu-multzoari gehien hurbiltzen zaion zuzena, ondorengo formularenbidez kalkulatzen da. Edozein zuzenen ekuazioa era hontakoa da: Y = a + b X

N Σ Yi*X1i - Σ Yi *Σ X1i b =–––––––––––––––––––––––

Σ (X1i)2 – (ΣX1i)2

a = -Y – b -X1

Gure kasuan ekuazioako parametroen estimazioak hauek dira:

10 * 13252 - 637 * 193 9579b = ––––––––––––––––––––––= –––––––––– = 1.7867

10*4261 - 1932 5361

a = -Y – b-X1 = 63.7 - 1.7867 * 19.3 = 29.21

Hemendik, datu-multzoari gehien hurbiltzen zaion zuzenaren ekuazioa, hau da:

Y = 29.21 + 1.7867 * X1

FRUSTRAZ = 29.21 + 1.7867 * TELEBIS1

Orain arte gehien hurbiltzen zaiona zuzen hau dela esan dugu, hala ere komeni da zenbateraino hur-biltzen den jakitea.

Baina zer esan nahi du asko edo gutxi hurbiltzeak?

Honen atzetik determinazio edo mugatze-koefizientearen esanahia eta, era berean, korrelazio--koefizientearena daude.

Ikus ditzagun ondoko hiru grafikoak. Adibideko hiru aldagai askeak banan-banan hartu ditugu, men-peko aldagaiekin gurutzatuz.

310

Page 323: Estatistika teoria eta praktika SPSSWIN erabiliz

1. Kasua

Determinazio-koefizientea 0.5866 da, eta begiratu nolako tarteak dauden puntu eta erregresio zuze-naren artean, edota zenbateraino hurbiltzen zaion erregresio zuzena gure datu-multzoari. Rxy = 0.7659

2. Kasua

Kasu honetan, determinazio-koefizientea 0.93595 da, oso handia, ia 1; eta distantzia edo tarteak osotxikiak. Rxy = 0.9674

3. Kasua

Hemen lortzen dugun hurbilketa oso txarra da. Determinazio-koefizientea nahikoa txikia da 0.1022.Tarteak, berriz, handiak. Korrelazio-koefizientea = - 0. 3198.

Korrelazio-koefizientea negatiboa denez, erregresio zuzenak beherantz egiten du. Erregresio zuzena-ren b koefizientea negatiboa da. Aurreko bi kasuetan, korrelazio-koefizientea positiboa zen, erregresiozuzenak gorantz egiten zuen eta b koefizientea positiboa zen.

311Erregresio anizkoitza

FR

US

TR

AZ

MAILASOZ

Page 324: Estatistika teoria eta praktika SPSSWIN erabiliz

Bestalde, gogora ezazu korrelazio-koefizientearen zeinuak, erlazioaren norabidea adierazten digula.Beraz, orokorrean honakoa esan dezakegu: zenbat eta ordu gehiago pasa telebista aurrean orduan etafrustrazio-maila handiagoa. Zenbat eta antsietate gehiago, orduan eta frustrazio-maila handiagoa. Etaazkenik, zenbat eta maila sozioekonomiko altuagoa, orduan eta frustrazio-maila baxuagoa.

Dena den, esan bezala, zenbateraino hurbiltzen den jakiteko, determinazio-koefizientea erabil deza-kegu edota ESTIMAZIOKO ERRORE TIPIKOA: See. Determinazio-koefizientea eta errore tipikoa honelaerlazionatzen dira:

S2ee = (1 – R2xy) S2y (1. formula)

Gure kasuan:

S2ee = ( 1 – 0.5349) * 324.33 = 150.85

Kalkulu hauek egiteko, zuzendutako determinazio- edo mugatze-koefizientea eta lagineko kuasiba-riantza erabili ditugu.

Dena dela, egokitzea ona den interpretatzea, determinazio-koefizientearen arabera errezago egingoda. Azken batean, 1. formulak adierazten duen bezala, estatistiko bien arteko erlazioa garbia da.

Erregresio zuzena kalkulatu eta hurbilketa-prozesuan egindako errorea aztertu ondoren, zuzen honenbidez aurresana egiteko era ikusiko dugu.

Telebista aurrean 20 ordu ematen dituen neska-mutikoarentzat bere frustrazio-mailarako egingo dugunaurresana hau izango da:

FRUSTRAZ=29.21 + 1.7867 * TELEBIS1 = 29.21 + 1.7867 * 20=64.94

Hau estimazio puntual bat da, eta tarte gisa planteatu nahi badugu, ondoko formulan oinarrituz egin-go dugu:

(X1i – -X1)2Y’i ± Tα S2ee [ 1 + 1/n +–––––––––– ]

(n – 1) S2x

Gure kasuan eta, Tα Student-en T tauletan, n - 2 askatasun-graduko lerroan lortzen dugun balioa delakontuan harturik, hau da, 8 askatasun-graduko lerroan, % 5eko erroreaz lan egiten baldin badugu, lortu-ko dugun balioa 2.306 izango da, eta kontuan hartuta S2ee = 120.63 dela, hau lortuko dugu:

(20 - 19.3)264.94 ± 2.306 120.63 [ 1 + 1/10 + ––––––––––––––– ] =

(10 - 1) 53.61

64.94 ± 2.306 * 11.52 = 64.94 ± 26.56 : [38.38, 91.50]

Egia esan, lortu dugun konfiantza-tartea ez da oso zehatza, zabala baizik. Honen arrazoiak bi dira;bata erregresio zuzen honen bidez lortu dugun hurbilketa oso txikia izatea: TELEBIS1 aldagaiaren alda-ketak, FRUSTRAZ aldagaiaren aldaketan % 58.66 esplikatzen du; % 42 esplikatu gabe gelditzen dela, ale-gia. Bigarren arrazoia menpeko aldagaiaren (FRUSTRAZ) bariantza oso handia izatea da, hau da, pertso-na ezberdinek lortzen dituzten puntuazioak oso aldakorrak izatea.

Erregresio-ekuazioen parametroen konfiantza-tarteak ere lor ditzakegu, hots, “a” eta “b” balioenak.Horretarako “a” eta “b” balioen desbideratze estandarretik abiatuko gara:

1 -XSa = S2ee –––– – ––––––––––

N (N – 1) S2x

312

���

���

Page 325: Estatistika teoria eta praktika SPSSWIN erabiliz

SeeSb = ––––––––––––

(N – 1) S2x

Konfiantza-tarteak eraikitzea ahalbidetuko duten estatistikoak ondoko hauek dira:

a bta = ––––– tb = –––––

Sa Sb

ta eta tb estatistikoak Student-en T banaketari jarraitzen zaizkio, N - k - 1 askatasun-gradurekin. Gurekasuan N-2 askatasun-graduarekin, k balioak erregresio-ekuazioan sartu ditugun aldagai aske edo inde-pendenteen kopurua adierazten baitu.

10.2. BARIANTZA-ANALISIAREKIN ERLAZIOA

Aipatu dugun bezala, erregresio sinplearen metodo linealaren funtsezko oinarria puntu-multzoari zuzenbat ahalik eta ondoen hurbiltzea litzateke.

Erregresio-ekuazioaz baliatuz, menpeko aldagaiaren aldakortasunaren zati bat besterik ez dugu azal-duko, beste zati bat azaldu gabe geratuko da.

Erregresio-analisiaren funtsezko erlazioa ondorengo bariantzaren deskonposaketa izango da.

Yren BARIANTZA = AZALDUTAKO BARIANTZA + AZALDU GABEKO BARIANTZA

Hemen ikusi dugun deskonposaketa eta bariantza-analisian egiten genuena berdinak dira. Berdintasunhau aprobetxatuz, Snedeckor-en F frogan lortutako hurbiltasuna azter dezakegu, aurreko berdinketanoinarrituz. Azaldutako bariantza erregresio-ekuazioaren baitan dago. Bestea, azaldu gabekoarena edoerroreena (hondarrarena) da.

Aurreko erlazioetatik, eta bariantza-analisiarekin dagoen antzekotasunagatik, ondoko erlazio haueklortuko ditugu:

BATEZBESTEKO KOADRATIKOA ERREGRESIOAREN ONDORIOZF = ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

HONDAR-BATEZBESTEKO KOADRATIKOA

HONDAR-KARRATUEN BATURAR2 = 1 – ––––––––––––––––––––––––––––––––––

KARRATUEN BATURA OROKORRA

Garbi dago, aldagaien artean zenbat eta erlazio handiagoa egon orduan eta gehiago esplikatzen duelaaldagai askeak, eta horregatik batezbesteko hondar-koadratikoa txikitu egingo da. Honen ondorioz, Fbalioa handiago egingo da. Erregresioren bidez lorturiko hurbiltze-egokitasuna F parametroen araberaaztertzen duen idazlerik bada, baina normalean, errezagoa izaten da determinazio-koefizientea erabil-tzea.

10.3. ERREGRESIO SINPLEA SPSSWIN ERABILIZ

Orain arte eginiko kalkulu guztiak berregin egingo ditugu, baina lantzen ari garen bi bertsioetan SPSSWINpaketea erabiliz.

Landuko ditugun lau aldagaien datuak tekleatuz hasi beharko dugu. Aldagaien definizioaren prozesuosoa eta datuen sarrera liburu honen bigarren zatian azaltzen dira, beraz, zuk jadanik datuak sartuta ditu-zula pentsatuko dut. Arazorik balego, beste aukera bat ere izango zenuke; hitzaurrean aipatutako Web

313Erregresio anizkoitza

�����

Page 326: Estatistika teoria eta praktika SPSSWIN erabiliz

orrialdean dagoen EREGRESIO.SAV izeneko fitxategia aurkituko duzu eta hau irekita horrelako leiho battopatuko duzu, atal honetako agindu edo azalpenen abiapuntua izango dena.

Aurrera.

Hona hemen, eman beharko dituzun pausoak.

EstadísticosRegresión

Lineal...

Eta leiho hau lortzen dut, bertan FRUSTRAZ aldagaia jarri dudalarik dependiente gisa eta TELEBIS1independiente gisa. Gainerantzekoa (WLS > >, Estadísticos, Gráficas, Guardar, Opciones,...), EZTAUKITU ERE! Aceptar.

314

Page 327: Estatistika teoria eta praktika SPSSWIN erabiliz

Lortuko dituzun emaitzak hauek dira.

SPSSWIN 6.1.3

* * * * M U L T I P L E R E G R E S S I O N * * * *

Listwise Deletion of Missing Data

Equation Number 1 Dependent Variable. FRUSTRAZ

Block Number 1. Method: Enter TELEBIS1

Variable(s) Entered on Step Number

1.. TELEBIS1

Multiple R ,76586

R Square ,58654

Adjusted R Square ,53485

Standard Error 12,28073

Analysis of Variance

DF Sum of Squares Mean Square

Regression 1 1711,56950 1711,56950

Residual 8 1206,53050 150,81631

F = 11,34870 Signif F = ,0098

-—-—-—-—-—-—-—-—-— Variables in the Equation -—-—-—-—-—-—-—-—-—

Variable B SE B Beta T Sig T

TELEBIS1 1,786794 ,530397 ,765856 3,369 ,0098

(Constant) 29,214885 10,948560 2,668 ,0284

End Block Number 1 All requested variables entered.

315Erregresio anizkoitza

Page 328: Estatistika teoria eta praktika SPSSWIN erabiliz

Eta 7.5 bertsiarentzat...

SPSSWIN 7.5

Regresión

Bi bertsioen formatoa ezberdina izan arren emaitzak baliokideak dira eta aurkeztu ere ia ordena bere-an aurkezten dira.

Bien arteko ezberdintasun bakarra emaitzak aurkezten dizkiguten hamarrenen (dezimalen) kopuruandago; 7.5 bertsioan 3 hamarrenera murrizten da. Eta gertaera hau aprobetxatuz iritzi partikular bat azal-du nahi nuke. Korrelazio-koefiziente baten datua ematen dugunean, zergatik esaten dugu 0.43792 balioduela? Zertarako hainbeste hamarren? Ez al litzateke nahikoa 0.44 esatea? Pisua galdetzen digutenean,zergatik ez dugu esaten 70.3256 kilo? Besteen artean egia ez litzatekeelako, eta indize estatistikoekin ereberdin gertatzen da. Askotan bi hamarren erabiltzea aski da, eta... soberan; pezetaz hitz egitean; milakamiloiz hitz egiten badugu egoera bestelakoa da, baina normalki ez da hori ohiko kasua.

316

Variables introducidas/eliminadasb

Modelo Variablesintroducidas

Variableseliminadas Método

1 TELEBISIa Introduci

a. Todas las variables solicitadas introducidasb. Variable dependiente: FRUSTRAZ

Reusmen del modelo

Modelo RR

cuadrado

Rcuadradocorregida

Errorde típ.

estimación

1 ,766a ,587 ,535 12,2807

a. Variables predictoras: (Constante), TELEBIS1

ANOVAb

ModeloSuma de

cuadradosMedia

cuadráticagl F Sig.

RegresiónResidualTotal

1711,5701206,5302918,100

189

1711,570150,816

11,349 ,010a1

a. Variable predictoras: (Constante), TELEBIS1b. Variable dependiente: FRUSTRAZ

Coeficientesa

Coeficientes noestandarizados

Coeficientesestandarizados

Modelo B Error típ. Beta

t Sig.

(Constante)TELEBIS1

29,2151,878

10,949,530 ,766

2,6683,369

,028,010

1

a. Variable dependiente: FRUSTRAZ

Page 329: Estatistika teoria eta praktika SPSSWIN erabiliz

Segi dezagun aurrera.

Bi bertsioek menpeko aldagaia zein den adierazten digute: FRUSTRAZ, eta ekuazioan lehen postuan,zein sartzen den ere bai, kasu honetan aldagai bakarra, hau da aldagai askea: TELEBIS1.

Ondoren, bi aldagaien arteko barne-erlazioaren analisiaren emaitzak aurkezten dizkigu.Erregresioarekin lan egin nahiko bagenu, erlazioaren alderdi deskribatzaile batekin bakarrik, hau litzate-ke oinarrizko zatia.

Hemen korrelazio-koefiziente hau dugu: .766 (.76586). Kasu honetan korrelazio-koefiziente sinple batizan arren, R edo Multiple R errotuluaren atzetik azaltzen da. Aldagai aske bakarrarekin lan egitea ez daohizkoena; normalki gehiagorekin lan egingo dugu, eta guk geuk ikusi beharko dugu zein erlazio/koefi-ziente-motari buruz ari den.

Ondoren, bere karratua, determinazio-koefizientea (R cuadrado) (.58654), eta determinazio-koefi-ziente zuzendua edo doitua (R cuadrado corregido-Adjusted R Square) izango ditugu, eta lehen esandugun bezala, balio honen bidez, egin dugun hurbilketaren egokitasuna aztertuko dugu. Kasu honetanerrore estandarra (error típico de la estimación) S2ee = 12.28073 da, zeinaren bidez hurbilketaren Yrenbariantza, determinazio-koefizientea eta errore estandarraren arteko erlazioa azter ditzakegun:

S2ee = (1 – R2) S2y = (1 - .534852) 324.233 = 150.81

Kontuan izan behar dugu Yren bariantzaren estimazio-balioa lagineko kuasibariantza dela, hau da:

Σ ( Yi – Y)2S2y = –––––––––––––

N – 1

Emaitzen hurrengo atalean, erregresio-ekuazio honi dagokion bariantza-analisiaren emaitzak agertzendira.

Egindako deskonposaketa honako hau da:

KARRATUEN BATURA OROKORRA = ERREGRESIOEN BATURA + HONDAR-BATURA

2918.1 = 1711.5695 + 1206.5305

Horrela, F balioa kalkulatzen du: 11.349 (11.3487) eta balio hau zoriz lortzeko dagoen probabilitateaere bai: .010.

Azkenik, VARIABLES IN THE EQUATION - MODELO izenpean bereizten den atalean erregresio--ekuazioa azaltzen zaigu; lehenengo zutabean aldagai aske edo independentearen izena eta hurrengoan“a” eta “b” parametroen balioak erregresio-ekuazioan, gure kasuan honakoa dena:

FRUSTRAZ = 29.21489 + 1.78679 * TELEBIS1

Hurrengo zutabeetan parametroen desbideratze estandarrak eta parametroen estimazioak azaltzenzaizkigu, ikerketaren aldagaiak puntuazio tipikoetan hartzen baititugu. Kasu honetan, hau da, erregresiosinplean, Beta balioa eta korrelazio-koefizientea berdinak dira. Azken bi zutabeetan T estatistikoa azal-tzen zaigu; estatistiko hau, B eta Beta balioen konfiantza-tarteak eraikitzeko erabil dezakegu. Azken zuta-bean, berriz, T balioen adierazgarritasuna, hau da, balio hauek zoriz lortzeko dagoen probabilitatea dago.Gure kasuan, erregresio sinplea denez, T balioaren adierazgarritasun-mailak eta erregresioaren F-k ber-din balio dute, 0.10, biak baliokideak baitira.

Lehen aipatu dugun bezala, erregresio-ekuazioa erabiliz pertsona batek telebista aurrean ematen duenordu-kopurua jakinik eta bere FRUSTRAZ aldagaiaren balioaren aurresana egin nahiko bagenu, era hone-tara egin beharko genuke. Demagun pertsona batek, astean 12 ordu pasatzen dituela telebista aurrean;pertsona honen FRUSTRAZen aurresana hau litzateke:

317Erregresio anizkoitza

Page 330: Estatistika teoria eta praktika SPSSWIN erabiliz

FRUSTRAZ = 29.21489 + 1.78679 * 12 = 50.65637

Asko?, gutxi? Emaitzaren balorazioa ikertzaileak, pedagogoak, psikologoak,... profesionalak, eginbeharko du. Estatistikaren lana hemen amaitzen da.

Erregresio sinplearen adibide bat aztertuz gero, berehala sortzen da honako galdera ere: nola hobedezakegu aldagai askearen bidez menpeko aldagaiarekiko lortu dugun hurbilketa? Hau da, nola lor deza-kegu determinazio-koefizientea handitzea? Gure helburua menpeko aldagaien, FRUSTRAZ aldagaiaren,bariantza proportzio handiagoan esplikatzea da. Horretarako, jada neurtuak ditugun beste aldagaiak(aldagai aske batzuk) erabiliko ditugu menpekoan nola eragiten duten ikertuz. Prozesu honi ERREGRESIOANIZKOITZA deritzogu.

10.4. ERREGRESIO ANIZKOITZA

Erregresio sinple eta anizkoitzaren planteamenduak teorikoki berdinak dira. Erregresio sinplean bi alda-gairekin ari gara lanean, bat askea eta bestea menpekoa. Erregresio anizkoitzean, berriz, menpeko alda-gaia bakarra da, baina aldagai askeak norberak nahi beste izan daitezke. Hortik dator “erregresio aniz-koitza” izena.

Ekuazio orokorra hau da:

Y = A + B1*X1 + B2*X2 +....+BK*XK

SPSSWIN paketearen emaitzak eta interesatzen zaizkigun estatistikoak aztertzeko lehengo adibidea-rekin segituko dugu.

Erregresio-analisiaren helburuak ondorengo bi puntu hauetan finka ditzakegu:

1.- Ekuazioen parametroen balioak kalkulatzea. Gure adibidean hau litzateke:

Y = A + B1*X1 + B2*X2 + B3*X3

2.- Aurreko puntuan kalkulatu dugun ekuazioaren bidez, menpeko aldagaiarekiko lortu dugun hurbilta-suna koantifikatzea.

Orain arte korrelazio- eta determinazio-koefizienteez hitz egin dugu. Dena den, kasu honetan hirualdagai aske dauzkagu: TELEBIS1, MAILASOZ eta ANTSIETA, eta menpeko aldagaia bakarra: FRUSTRAZ.

Orain arte ikusitako formulekin ondorengo korrelazio-matrizea lor dezakegu.

SPSSWIN erabiliz lortu nahi badituzu, REGRESIO.SAV fitxategia ireki ondoren, eman behar dituzunpausoak hauek dira:

EstadísticosCorrelaciones

Bivariadas....

Eta lau aldagaien izenak aukeratu ondoren, era honetako emaitzak lortuko dituzu 6.1.3 bertsioan. 7.5bertsiokoak ere berdinak dira baina itxura diferentea dute. Kontuz: aldagaiak beste ordena baten sartubadituzu, emaitzak beste ordena baten agertuko zaizu, baina, noski, emaitzak hemen aurkezten direnenberdineak izan behar dira.

318

Page 331: Estatistika teoria eta praktika SPSSWIN erabiliz

FRUSTRAZ TELEBIS1 ANTSIETA MAILASOZ

FRUSTRAZ 1.0000 .7659 .9674 -.3198

TELEBIS1 .7659 1.0000 .8313 -.7488

ANTSIETA .9674 .8313 1.0000 - .4657

MAILASOZ - .3198 -.7488 -.4657 1.0000

Menpeko aldagaiarekin erlazio handiena duen aldagai askea ANTSIETA da. Aurreko matrizean ikusdezakegun bezala, aldagai guztiak beren artean erlazionatuta daude.

Korrelazio-matrize hau aztertuz gero, FRUSTRAZ eta TELEBIS1 aldagaien arteko harremana planteadezakegu, ANTSIETA aldagaiaren eragina jasaten duela esanaz, hau da, telebistak haurrengan sortzenduen frustrazioa haurraren antsietateagatik izan daitekeela esanaz. Erlazio berri hau koantifikatzen lagun-tzen du estatistikak, korrelazio PARTZIALAREN bidez. (3. gaian, jada, ikusi dugu kontzeptu hau, bainahemen beharrezkoa denez, laburbilduz, berrikusi egingo dugu).

Korrelazio partzialaren koefizienteez hitz egin ahal izateko gutxienez hiru aldagai behar ditugu, bialdagairen arteko korrelazio partziala kalkulatzen ari garenean, partziala izateko erlazio honetatik hiru-garren aldagaiaren eragina baztertu egin behar baitugu. Hau da, demagun FRUSTRAZ eta TELEBIS1 alda-gaien arteko erlazioa kalkulatu nahi dugula, baina erlazio honetan ANTSIETA aldagaiak duen eraginabaztertuz. Erlazio hau koantifikatzen duen koefizientea korrelazio partziala izango da eta honela adiera-ziko dugu: Ry1.2

Ry1.2 idazteak, Y eta X1en arteko erlazioan X2 aldagaiaren eragina baztertuz gelditzen den erlazioaadierazten du. Kalkuluak, formula honen bidez egingo ditugu, non Ry1, Y eta X1en arteko korrelazio--koefizientea den, R12, X1 eta X2en artekoa, etab.

Ry1 – Ry2 * R12Ry1.2 =–––––––––––––––––––––––

√ (1 – R2y2) (1 – R212)

Gure kasuan korrelazio partzialen koefizientea hau izango da:

.7659 - .9674 * .8313 - .0383Ry1.2 = ––––––––––––––––––––––– = –––––––– = -.2721

√(1 - .96742) (1 - .83132) .1407

Orain arte lortu ditugun emaitzen interpretazioa oso argigarria izan daiteke; hona hemen zein direnhauek.

FRUSTRAZ eta TELEBIS1 aldagaien arteko korrelazio-koefizientea .7659 da. Beraz, esan genezake,haur batek telebista aurrean zenbat eta ordu gehiago pasa orduan eta frustrazio handiagoa izango duela.Hala ere, harreman honetatik haurraren antsietatea baztertzen badugu, hau da, haur honek inongo antsie-taterik ez duela pentsatuko bagenu, gure aldagai bien arteko erlazioa alderantzizkoa izango litzateke, hauda korrelazio partziala -.2721 da. Honek zera esan nahi du: FRUSTRAZ eta TELEBIS1 aldagaien artekoerlazioan, telebistak sortzen duen antsietatea dagoela tartean. Gogora dezagun, beti ere, datu simulatue-kin ari garela lanean.

Bi aldagaien arteko erlazioan, hirugarrenaren eragina baztertu dugu aipatutako kasuan, era bereanbazter dezakegu laugarren aldagaiaren eragina, bosgarrenarena ...

Bi aldagairen eragina baztertzen badugu, adibidez demagun Y eta X1en arteko erlazioa kalkulatu nahidugula baina X2 eta X3ren eragina baztertuz, orduan, koefiziente hau era honetan izendatuko dugu:Ry1.23, eta bere balioa lortzeko formula hau erabiliko dugu:

Ry1.2 - Ry3.2 * R13.2Ry1.23 = ––––––––––––––––––––––

√ (1 - R2y3.2) (1 - R213.2)

319Erregresio anizkoitza

Page 332: Estatistika teoria eta praktika SPSSWIN erabiliz

Korrelazio-koefiziente partzial hau SPSSWIN erabiliz kalkulatu nahi badugu, FRUSTRAZ eta TELEBIS1aldagaien arteko erlazioa baina erlazio honetan ANTSIETA aldagaiak daukan eragina baztertuz, REGRE-SIO.SAV fitxategia ireki eta honako pausoak eman behar ditugu:

EstadísticosCorrelaciones

Parciales....

Variables-en tokian, FRUSTRAZ eta TELEBIS1 aldagaiak jarri beharko ditugu, eta Controlar para ager-tzen den tokian ANTSIETA. Lortuko dugun emaitza era honetakoa izango da:

Partial Corr

- P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S -

Controlling for.. ANTSIETA

FRUSTRAZ TELEBIS1

FRUSTRAZ 1,0000 -,2730

( 0) ( 7)

P= , P= ,477

TELEBIS1 -,2730 1,0000

( 7) ( 0)

P= ,477 P= ,

(Coefficient / (D.F.) / 2-tailed Significance)

Bi azalpen:

1.- Guk eskuz lortu dugun emaitzarekin alde txiki bat dago, baina hamarrenen arazoa besterik ez da.

2.- Korrelazio-koefizientearen azpian 7 balioa agertzen da; hau horrela da, 10 pertsonen datuak ditugu-lako baina 3 aldagairekin: 10 elementu ken 3 aldagai = 7 askatasun-gradu (10 - 3 = 7). Proba bat egindezakezu, elementu eta aldagai berdinekin, baina MAILASOZ aldagaien eragina baztertuz; korrelazio--koefiziente partziala kalkulatzen baduzu, 6 zenbakia agertuko zaizu. Egin proba!

10.5. KORRELAZIO-KOEFIZIENTE ANIZKOITZA

Orain arte kalkulatu ditugun korrelazio-koefizienteek, bi aldagairen arteko erlazioa neurtzen dute. Orainaztertuko dugun koefiziente berriak, honako harremana adieraziko du: alde batetik aldagai bakar bat (Ydeituko dioguna), eta bestetik aldagai-talde bat. Demagun FRUSTRAZ aldagaia eta TELEBIS1, ANTSIETAeta MAILASOZ aldagaien arteko erlazioa kalkulatu nahi dugula, baina azken hiru aldagaiak elkarturikhartuta. Erlazio hau adierazteko KORRELAZIO ANIZKOITZA edo KOEFIZIENTEA erabiliko dugu.

Lehen bezala, korrelazio-koefizienteen karratua DETERMINAZIO edo MUGATZE-KOEFIZIENTEAizango da, kasu honetan ANIZKOITZA.

Garrantzi handikoa da mugatze-koefiziente hau, erregresio anizkoitzaren bidez lorturiko hurbiltasunakalkulatzeko erabiliko baitugu.

Mugatze-Koefiziente Anizkoitzak aldagai askeen multzo baten bidez esplikatzen den menpeko alda-gaiaren bariantzaren portzentaia adierazten digu.

320

Page 333: Estatistika teoria eta praktika SPSSWIN erabiliz

Demagun Y aldagaia eta X1 eta X2 aldagaien arteko determinazio-koefizientea kalkulatu nahi dugu-la, hau da, X1 eta X2k, bien artean, esplikatzen duen Y aldagaiaren bariantzaren portzentaia kalkulatunahi dugula. Beste era batera esanda, X1 eta X2 aldagaiek Y aldagaiaren aldaketak zenbateraino esplika-tzen dituzten. Formula honen bidez kalkulatuko dugu.

R2y.12 = 1 - [(1 - R2y1)*(1 - R2y2.1)]

Y aldagaia eta X1, X2 eta X3 aldagaien arteko mugatze-koefizientea kalkulatu nahi badugu, formulahau erabiliko genuke:

R2y.123 = 1 - [(1 - R2y1)*(1 - R2y2.1)*(1 - R2y3.12)]

Gure adibidean, gero ikusiko dugun bezala, Y eta X1, X2 eta X3ren arteko R2y.123, .96118 da. Beraz,adibidean erabili ditugun hiru aldagai askeek FRUSTRAZ menpeko aldagaiaren bariantzaren % 96.118esplikatzen dutela ikus dezakegu.

Erregresio sinplearen kasuan bezala, gehienetan erabiliko ditugun mugatze-koefizienteak ZUZEN-DUAK izango dira, eta zoriaren eragina orekatzeko erabiltzen den faktorea ezarriz, DETERMINAZIO--KOEFIZIENTE ANIZKOITZ ZUZENDUA lortzeko erabiliko dugun formula, hau izango da:

k (1 - R2)R2a = R2 –––––––––––––

(N - k -1)

non: k erabili ditugun aldagai askeen kopurua denN lagineko elementuen kopurua den.

Gure kasuan:

3 (1 – .961182)R2a = .96118 – –––––––––––––– = .94177

(10 – 3 –1)

Orain arteko emaitzak, SPSSWIN paketeak nola aurkezten dizkigun ikusiko dugu. Baina lehenago,nola lortu ikusiko dugu.

Emaitzak lortzeko, behin REGRESIO.SAV fitxategia ireki ondoren, pauso hauek eman behar dira:

EstadísticosRegresión

Lineal...

Eta era honetako leiho bat izango dugu aurrean. Hemen, Dependiente FRUSTRAZ, eta independien-te(s), ANTSIETA, MAILASOZ eta TELEBIS1 idatzi eta jarri ondoren, BESTEA bere horretan utziko dugu.

Método agertzen den tokian: INTRODUCIR utziko dugu. Gero “metodo” ezberdinak nolakoak direnikusiko dugu, baina oraingoz utzi dagoen-dagoenean.

Aceptar.

321Erregresio anizkoitza

Page 334: Estatistika teoria eta praktika SPSSWIN erabiliz

Lortu ditugun emaitzak:

SPSSWIN 6.1.3

* * * * M U L T I P L E R E G R E S S I O N * * * *

Listwise Deletion of Missing Data

Equation Number 1 Dependent Variable. FRUSTRAZ

Block Number 1. Method: Enter TELEBIS1 ANTSIETA MAILASOZ

Variable(s) Entered on Step Number

1.. MAILASOZ

2.. ANTSIETA

3.. TELEBIS1

Multiple R ,98040

R Square ,96118

Adjusted R Square ,94177

Standard Error 4,34511

Analysis of Variance

DF Sum of Squares Mean Square

Regression 3 2804,82029 934,94010

Residual 6 113,27971 18,87995

F = 49,52026 Signif F = ,0001

-—-—-—-—-—-—-—-—-— Variables in the Equation -—-—-—-—-—-—-—-—-—

Variable B SE B Beta T Sig T

TELEBIS1 ,361423 ,498211 ,154913 ,725 ,4955

ANTSIETA 1,064928 ,179336 ,949726 5,938 ,0010

MAILASOZ 4,053838 2,279663 ,238494 1,778 ,1257

(Constant) -18,010005 0,411325 -1,730 ,1344

End Block Number 1 All requested variables entered.

322

Page 335: Estatistika teoria eta praktika SPSSWIN erabiliz

7.5 bertsioa erabiliz:

SPSSWIN 7.5

Regresión

Bi bertsioetako emaitzak aurkezteko formatuek, erregresio sinplearenarekin bat egiten dute. Han beza-la, bi bertsioetako aurkezpenak itxurak ezberdintzen ditu, baina estatistiko ezberdinen aurkezpenen orde-na eta balioa berdinak dira.

Emaitzen lehen zatian, ekuazioan sartu diren aldagaien zerrenda agertzen da, eta azpian, erregresioanizkoitzaren bidez lortutako hurbiltasuna. Korrelazio-koefiziente anizkoitza .98040 da, bere karratua,determinazio-koefizientea R2 = .96118 da, determinazio-koefiziente zuzendua .94117, eta errore estan-darra 4.34511.

Azaltzen den hurrengo balioa F-rena da eta ondoren bere adierazgarritasuna, hau da F-ren balioa zorizlortzeko dagoen probabilitatea: 0.0001.

323Erregresio anizkoitza

Variables introducidas/eliminadasb

Modelo Variablesintroducidas

Variableseliminadas Método

1 MAILASOZ,ANTSIETA,a

TELEBIS1Introducir

a. Todas las variables solicitadas introducidasb. Variable dependiente: FRUSTRAZ

.

Reusmen del modelo

Modelo RR

cuadrado

Rcuadradocorregida

Errorde típ.

estimación

1 ,980a ,961 ,942 4,3451

a. Variables predictoras: (Constante), MAILASOZ, ANTSIETA, TELEBIS1

ANOVAb

ModeloSuma de

cuadradosMedia

cuadráticagl F Sig.

RegresiónResidualTotal

2804,829113,280

2918,100

369

934,94018,880

49,520 ,010a1

a. Variable predictoras: (Constante), MAILASOZ, ANTSIETA, TELEBIS1b. Variable dependiente: FRUSTRAZ

Coeficientesa

Coeficientes noestandarizados

Coeficientesestandarizados

Modelo B Error típ. Beta

t Sig.

(Constante)TELEBIS1ANTSIETAMAILASOZ

-18,010,361

1,0654,054

10,411,498,179

2,280

,155,950,238

-1,730,725

5,9381,778

,134,495,001,126

1

a. Variable dependiente: FRUSTRAZ

Page 336: Estatistika teoria eta praktika SPSSWIN erabiliz

Hurrengo blokean erregresioaren ekuazioa agertzen da. Lehenengo zutabean erregresio-ekuazioarenparametroen estimazioak daude eta hemendik gure erregresio-ekuazioa lor dezakegu.

FRUSTRAZ= -18.01+ 1.06*ANTSIETA+ 4.05*MAILASOZ+ .36*TELEBIS1

Ekuazio honetatik abiatuz, FRUSTRAZen aurresanak egin ditzakegu. Demagun pertsona baten alda-gaien balioak hauek direla:

ANTSIETA = 70 TELEBIS1= 15 MAILASOZ = 3

Pertsona honen FRUSTRAZ aldagaiarentzat egingo dugun aurresana hau izango da:

FRUSTRAZ = -18.01 + 1.06 * 70 + 4.05 * 3 + .36 * 15 = 73.74

Aurresana 73.74 litzateke eta aurresan honen baliozkotasuna, determinazio- edo mugatze--koefizienteak emango digu. Aurresan hau FRUSTRAZ aldagaiaren % 94.11 kontrolatzen dugularik egi-ten dugu. Oraindik % 5.89 kontrolatu edo esplikatu gabe daukagu, eta honek hanka sartzeko bidea ema-ten digu.

10.5.1. Aldagai askeen aukeraketa. Ekuazioa osatzeko metodoak

Orain arte erregresioan lortzen ziren emaitzak aztertzen saiatu gara, eta lortzen dugun hurbiltasuna han-dia ala txikia den determinazio- edo mugatze-koefizientea erabiliz ikusi dugu.

Erregresio-ekuazioen helburu garrantzitsuetako bat R2 balio gorena lortzea izango da. Balio hau han-ditzeko erabiltzen den metodoetako bat ekuazio barruan aldagai gehiago sartzea izango da. Bainabatzuetan hau ez dela nahikoa izango ikusiko dugu, aldagai aske berria, menpeko aldagaia esplikatzenduena, lehendik ekuazioan ditugun aldagaiek ia esplikatuta eduki dezaketelako. Bosgarren aldagaitikaurrera oso kasu gutxitan handituko da determinazio-koefiziente. Bestalde, ekuazio barruan zenbat etaaldagai gehiago sartu orduan eta zailagoa izango da emaitzak interpretatzea.

SPSSWIN paketeak, orain arte aipatu ditugun arrazoiak kontuan hartuta, aldagaiak ekuazioan sartze-ko 5 metodo diferente erabiltzeko aukera ematen digu. Metodoak hauek dira:

1.- INTRODUCIR: (ENTER). Sinpleena da hau. Metodo honetan, aldagai aske guztiak batera sartzen diraekuazioan. Aurreko adibidean erabili duguna da.

2.- PASOS SUCESIVOS. STEPWISE ere deitua. Agian hau da gehien erabiltzen dena; nahiz eta prozesua-ren bukaeran (batzuetan) INTRODUCIR metodoaren emaitza berdinak lortu, bidean jasotako infor-mazioa aberatsagoa da. Esan beharra dago etapakako metodoa dela; hau da, metodo honetan, alda-gai guztiak ez dira denak batera sartzen ekuazioan, banan-banan baizik.

Ekuazioan sartzen den lehenengo aldagai askea, menpeko aldagaiarekiko korrelazio handiena duenaizango da. Aldagai honekin kalkulu guztiak egin eta azaldu ondoren, bigarren aldagaia sartuko du.Bigarren aldagai hau sartzean, korrelazio-koefiziente partzialak hartzen ditu kontuan. Hau da, lehe-nengo pausoan kanpoan gelditu diren aldagai askeen eta menpekoen arteko korrelazio-koefizientepartzialak kalkulatzen ditu, ekuazio barruan dagoen aldagaiaren eragina baztertuz. Hau da, bigarrenaldagaia ekuazioan sartzean komeni da, sartuko den aldagaiak menpeko aldagaien bariantzaren aha-lik eta portzentaia handiena esplikatzea, baina ekuazio barruan jada dagoenak esplikatzen ez duenaizatea. Beraz, hau da korrelazio-koefiziente partzialak adierazten duena, eta horregatik erabiliko duguekuazioan zein aldagai sartuko den erabakitzeko. Bigarren aldagaia zein izango den erabaki ondoren,berriz kalkulu guztiak egin eta azaldu egiten ditu. Hirugarren aldagaia sartuko du ekuazioan.Hirugarren aldagaia sartzean ere, orain arte kanpoan gelditu diren aldagai aske eta menpekoen arte-ko korrelazio-koefiziente partzialak kalkulatzen ditu, ekuazio barruan sartuta dauden aldagaien eragi-na baztertuz, eta horrela jarraitzen du prozesua amaitu arte.

324

Page 337: Estatistika teoria eta praktika SPSSWIN erabiliz

Prozesua bi era ezberdinetara amai daiteke, aldagai guztiak sartuta geratzen direlako edo SPSSWINprograma-paketeak aldagai guztiak ekuazioan sartu baino lehenago prozesua gelditu egiten duelako.Honek esplikazio erraza du: aldagai berri bat sartzean, lehen esan bezala, korrelazio partzialak kal-kulatzen ditu, baina batzuetan korrelazio-koefiziente partzial hauek oso txikiak izatea gerta daiteke;hau da, ekuazioan sartu gabe gelditzen diren aldagaiak menpeko aldagaiari buruz esplikatzen duenajada barruan dauden aldagaiek esplikatzea. Orduan, aldagai berririk ez du sartzen eta prozesua gel-ditu egiten da. Demagun bi aldagai aske berdin ditugula; ekuazioan bat sartzen badugu bigarrena sar-tzea alferrikakoa izango da, ezer berririk ez baitu esplikatuko. PASOS SUCESIVOS (STEPWISE) meto-doa erabiltzen dugunean, SPSSWIN paketeak zentzu honetan egiten du lana. Korrelazio-koefizientepartzialak txikiak edo handiak diren erabakitzeko, determinazio- edo mugatze-koefizienteen goraka-da azaltzen duen F balioa eta balio honen adierazgarritasuna erabiltzen ditu.

Non jarri mugak aldagai bat ekuazioan sartu edo ez, ala ekuaziotik atera edo ez erabakitzeko? Mugakgure esku daude: Opciones botoia aukeratuta era honetako leiho bat aurkituko duzu.

Hemen, erabil ditzakegun 4 aukera ezberdin aurkituko ditugu: bi aldagai ekuazioan sartzeko erabilditzakegunak, eta beste biak ekuaziotik aldagaiak ateratzeko. Zein erabili? Behar bada errazena Usarprobabilidad de F izan daiteke, hemen nahi ditugun probabilitateak finka baititzakegu; arruntenak .05eta .01 dira.

3.- ELIMINAR. Zenbaitetan, aldagai guztiak ekuazioan sartzen dira, bloke batean, lehen ikusi dugun“Introducir” metodoaz baliatuz, eta ondoren, ekuaziotik aldagaiak banan-banan ezabatu egiten dira,kasu bakoitzean aldagai askeari buruzko informazio gutxien eskaintzen didana.

4.- HACIA ATRAS. Opciones-en definitu ditugun irizpideen arabera, banan-banan aldagaiak ezabatzengoaz, aldagai gehiago ezabatu ezin den azken eredu bat lortzen den arte.

5.- HACIA ADELANTE. Opciones-en definitu ditugun irizpideen arabera, aldagaiak banan-banan gehi-tzen dira, sartzeko aldagai gehiago ez dagoen azken eredua lortu arte.

10.5.2. Erregresioa aplikatzeko baldintzak

Metodo hau oso erabilgarria eta erabilia da, baina askotan, erabiltzeko bete behar diren baldintzak ez dirakontuan hartzen. Egia da, batzuetan, nahiz eta baldintza hauek ez bete, lortuko ditugun emaitzak ba-liagarriak izango direla; hala ere, metodoa aplikatu baino lehen ia baldintza hauek betetzen diren ala ezkontuan hartzea komeni da.

Lehenengo, eta oinarrizko, baldintza aldagaia koantitatiboa izatea da.

325Erregresio anizkoitza

Page 338: Estatistika teoria eta praktika SPSSWIN erabiliz

Eredu teorikoak bete behar dituen baldintzak hauek dira:

• LINEALTASUNA: menpeko aldagaiaren eta aldagai askeen arteko erlazioak linealak izan behar dute.

• EREDUAREN ZEHAZPENA: eredu terorikoak ondo zehaztua egon behar du. Menpeko aldagaiarekinerlazio handia duten aldagaiek ereduan azaldu behar dutela esan nahi du honek.

• ERROREEN INDEPENDENTZIA: aldagai askeak errorerik gabe neurtzen dira.

• EREDU ALBORAGABEA da.

Erregresioa inferentzia-ikuspuntutik erabiltzeko, hau da, aurresan zehatzak egiteko, bete beharrekobaldintzak aurrekoak eta ondorengoak izango dira.

• HOMOZEDASTIZITATEA. Aldagai askeen balio ezberdinetarako, menpeko aldagaien bariantzek ber-dinak izan behar dute.

• ASKATASUNA. Elementu baten balioak, beste elementuen balioekin ez du erlaziorik.

• MULTIKOLINEALTASUNIK EZA. Aldagai askeek beren artean aske izan behar dute; hau da, aldagaiaskeen arteko korrelazio-koefizienteek 0 edo oso txikiak izan behar dute.

• NORMALTASUNA. Egiten diren hondar edo erroreen banaketak normala izan behar du.

Hipotesi- edo aplikazio-baldintza hauetan erregresioaren eredu teorikoa erabil dezakegu.

10.6. ERREGRESIO ANIZKOITZA ETA SPSSWIN: ADIBIDE OROKORRA

Hemendik aurrera, orain arte ikusitako guztia asimilatzen lagunduko didan Erregresio Anizkoitzeko adi-bide osatu bat ikusiko dugu.

Aplikaziorako hipotesia ondorengoa da:

Aditu batek ikasleen euskara-ezagutzak aztertu nahi ditu. Aldagai honetan zein dira ikasleen mailaezberdina azaltzen duten aldagaiak? Galdera honi erantzuten saiatzeko, aztertu nahi dugun aldagai aske-arekin, teorikoki erlazionatuak dauden 5 aldagairekin lan egitea interesgarria dela erabaki du gaian adi-tua denak: Amaren euskara-maila (EUSKAMA), Ikasteko ohiturak (OHITURA1), Adimena (RAVEN),Ingelesean lortutako emaitzak (INGELES) eta Lengua espainolean lortutako emaitzak (LENGUA).

Hau guztia, gure, lan-fitxategiko LIBURU.SAV, aldagaietara itzuli ondoren, honako planteamendu haugeratuko litzaiguke: EUSKTOT menpeko aldagaia aztertzen saiatzen gara, eta aldagai aske bezala lehenaipatutako bostak ditugu.

Erregresioaren emaitzak lortzeko, LIBURU.SAV fitxategia ireki ondoren eman beharreko pausoakhauek dira:

EstadísticosRegresión

Lineal...

Eta, ondoren aurkezten dudan leihoan azaltzen den bezalaxe, menpekoa edo “dependiente”n EUSK-TOT izena hartuko dut, “independiente(s)” edo askeetan aztergai diren 5 aldagaiak: EUSKAMA, OHITU-RA1, RAVEN, INGELES eta LENGUA. Aldagaiak hartzeko metodo bezala, PASOS SUC. (STEPWISE) meto-doa edo, pausoka aldagaiak hartzeko metodoa hautatu dut.

326

Page 339: Estatistika teoria eta praktika SPSSWIN erabiliz

Hasi aurretik, hasiera batean behintzat, lehen aipatutako aplikazio-baldintzak betetzen dituzten alda-gaiak direla azpimarratzea garrantzitsua da; zenbakizko aldagaiak dira, menpeko aldagaiarekin erlazioalineala dute. Ereduak koherentzia teorikoa duela eta aldagaiak errorerik gabe neurtuak daudela, edohobeki esanda neurketan sesgorik ez dagoela, pentsatzekoa da.

Erregresio anizkoitzeko emaitzak aztertu aurretik, ikerketaren parte izango diren aldagaien artekobarne-erlazioak ezagutzea ere komeni da. Adibideko sei aldagaienak hauek dira:

- - Correlation Coefficients - -

EUSKTOT EUSKAMA LENGUA OHITURA1 INGELES RAVEN

EUSKTOT 1,0000 ,4660 ** ,2827 ** ,2917** ,3747 ** ,3143 **

EUSKAMA ,4660 ** 1,0000 -,1862 ** -,0657 -,0277 ,0178

LENGUA ,2827 ** -,1862 ** 1,0000 ,4724** ,551 ** ,3902 **

OHITURA1 ,2917 ** -,0657 ,4724 ** 1,0000 ,9109 ** ,3717 **

INGELES ,3747 ** -,0277 ,5517 ** ,9109** 1,0000 ,3631 **

RAVEN ,3143 ** ,0178 ,3902 ** ,3717** ,3631 ** 1,0000

* - Signif. LE ,05 ** - Signif. LE ,01 (2-tailed)

" , " is printed if a coefficient cannot be computed

Matrize honetan, EUSKTOT aldagaiarekin erlaziorik handiena EUSKAMA-k duela ikusten dugu. Horidela eta, erregresio-ekuazioan parte hartuko duen lehenengo aldagaia EUSKAMA izango da.

Ikus dezagun orain, nola aurkezten dizkigun emaitzak. Alde batetik, 6.1.3 bertsiokoak daude, eta bes-tetik, 7.5 bertsiokoak. Banaketa honen zergatia, bi bertsioek emaitzak aurkezteko duten modu ezberdi-nean datza.

327Erregresio anizkoitza

Page 340: Estatistika teoria eta praktika SPSSWIN erabiliz

10.6.1. 6.1.3 bertsioko emaitzak

“Pasos Sucesivos” metodoan, bertsio honek, emaitzak etapa ezberdinetan aurkezten dizkigu. Aldagai batsartzen duen bakoitzean, erregresio-ekuazioaren emaitzak aurkezten ditu. Horrela, hemen ditugu lehenetapako emaitzak:

1. etapa

* * * * M U L T I P L E R E G R E S S I O N * * * *

Listwise Deletion of Missing Data

Equation Number 1 Dependent Variable.. EUSKTOT

Block Number 1. Method: Stepwise Criteria PIN ,0500 POUT ,1000

RAVEN OHITURA1 EUSKAMA LENGUA INGELES

Variable(s) Entered on Step Number

1. EUSKAMA AMAREN EUSKARA MAILA

Multiple R ,49345

R Square ,24350

Adjusted R Square ,24090

Standard Error 13,53835

Analysis of Variance

DF Sum of Squares Mean Square

Regression 1 17226,37775 17226,37775

Residual 292 53519,76170 183,28686

F = 93,98589 Signif F = ,0000

------------------ Variables in the Equation ------------------

Variable B SE B Beta T Sig T

EUSKAMA 8,766468 ,904260 ,493453 9,695 ,0000

(Constant) 46,419751 1,830683 25,357 ,0000

------------- Variables not in the Equation -------------

Variable Beta In Partial Min Toler T Sig T

RAVEN ,292067 ,335685 ,999332 6,079 ,0000

OHITURA1 ,335085 ,384097 ,993994 7,097 ,0000

LENGUA ,349304 ,395366 ,969175 7,343 ,0000

INGELES ,376076 ,432175 ,999032 8,175 ,0000

Emaitzak erabilitako erregresio-ereduaren aurkezpenarekin hasten dira: menpeko aldagaia EUSKTOTda eta aldagaiak hartzeko metodoa berriz, STEPWISE da. Ereduan sar litezkeen aldagai askeen zerrendaere aurkezten digu.

Azalpen bat behar duten eta erregresio-leiho nagusian alda daitezkeen bi balio aurkezten dizkiguOpciones botoia sakatuta: PIN eta POUT.

PIN, aldagaia onartzeko irizpide bat da (kasu honetan PIN = .05); aldagai berri bat ekuazioan sartze-ko, aldagai honek azaldutako bariantzaren handitzea (F) zorizkoa izateko probabilitateak PIN balioabaino txikiagoa izan behar duela esan nahi du honek.

328

Page 341: Estatistika teoria eta praktika SPSSWIN erabiliz

POUT, aldagai bat baztertzeko irizpidea da (kasu honetan POUT = .1000). Hau da, aldagai bat ekua-zioan sartu den arren, eredu honekin baztertu ere egin daiteke. Aldagai honek azaldutako bariantzarenhanditzea zorizkoa izateko probabilitatea, POUT balioa baino handiagoa denean bakarrik baztertuko da.

Ondoren, erregresioaren emaitzak aurkezten ditu.

Ekuazioan sartu den lehenengo aldagaia EUSKAMA da, genituenen artean, EUSKTOT aldagaiarekinerlazio gehien zuena. Rxy = 0.49345. Ereduko aldagai guztien artetik EUSKAMA menpeko aldagaia,hobekien azaltzen duena bera dela adierazten dit honek.

Determinazio-koefizientea, R2 = 0,2435; hau da, EUSKAMA aldagaiak EUSKTOT aldagaian ematendiren aldaketen % 24.35 azaltzen du.

Normalki, determinazio-koefizientea zoriak zertxobait puztu egiten duela genioen. Horregatik, aipatukoefizientea zuzendu eta determinazio-koefiziente doituarekin lan egitea komeni da. Beraz, zuzenketaegiten lagunduko didan formula hau izango da:

k (1 - R2) 1 (1 - 0.24350)R2z = R2 ––––––––––––– = 0.24350 – ––––––––––––– = 0.24090

(N - k -1) 294 - 3

Bertan, “k” ereduko aldagai askeen kopurua da (oraingoz 1) eta N subjektu-kopurua. Gure kasuanemaitza 0.24090 hau izan da. Ah! Nola dakit 294 subjektu daudela analisian? Kalkulua erraza da: barian-tzaren analisiak zer askatasun-gradua du? 292 + 1. Ongi, bada hauei 1 gehitu behar diegu. Gogora ezazu,batezbestekoa ezagutuz gero, azken datua beti aurrekoetatik lor dezakegula; eta bestela, bizkorrago egi-teko, zoaz analisiaren amaierara eta datu hau topatuko duzu. Baina ez da gauza bera! Hieroglifikoa aska-tu aurretik emaitza ikustea bezalaxe da, ezta? Jarrai dezagun aurrera!

Ondoren, errore estandarra aurkezten digu (13.53835). Determinazio-koefizienteak gora egiten dueneran, errore estandarrak behera egiten du.

Bariantzaren analisiaren emaitzekin segitzen du jarraian, F-ren balioa 93.98 dela eta azaldutakobariantzaren portzentai hau zorizkoa izateko probabilitatea 0.0000 dela adieraziz. Zoriak ez du ia eragi-nik, beraz, aldagai hau erregresio-ekuazioan sartzeak badu zentzua.

Aurrera.

Segidan, erregresio-ekuazioaren emaitzak aurkezten ditu. Variables in the equation blokean, B zuta-bean, hain zuzen, kasu honetan honela deskriba genezakeen erregresio-ekuazioa aurkezten digu:

EUSKTOT = 46.41 * 8.76 * EUSKAMA

Ekuazio hau izango da EUSKTOTen balioa iragartzeko erabil dezakedana, baina menpeko aldagaianematen diren aldaketen % 24.35 bakarrik kontrolatzen dudala kontuan izanik. Gutxitxo.

Hurrengo zutabeetan, estimatzaile bakoitzaren errore estandarra (a eta b) eta Betaren (tipifikatutako B--ren balioa) balioa aurkezten dizkigu. Kasu honetan, Betaren balioa korrelazio-koefizientearekin bat eto-rriko da, menpeko aldagai bakarrarekin ari garelako lanean.

Ondoren, T-ren balio ezberdinak eta bere esanahiak azaltzen zaizkigu. Gogora dezagun T, B-renbalioa zati errore estandarra eginez (B / SE B) lortzen dugula. Eta balio hau izango da estimatzaileenkonfiantza-tarteak kalkulatzean erabiliko duguna.

Azkenik, erregresio-ekuazioaren parte izan ez diren aldagaien emaitzak aurkezten dizkigu. Menpekoaldagaitik azaldu gabe geratzen den zatia ondoen esplikatzen duen aldagaia zein den aztertzeko, orain-dik ekuazioan sartu ez direnen artetik, ongi begiratuko dugun zutabea PARTIAL da.

329Erregresio anizkoitza

Page 342: Estatistika teoria eta praktika SPSSWIN erabiliz

Zein da korrelazio partzialeko koefiziente handiena duena? INGELES. Hau izango da ba, hurrengo eta-pan sartuko dena. Zein BETA izeneko koefizienterekin sartuko da ekuazioan? .37607rekin.

Segidan, berehala azalduko dudan indize berri baten emaitza aurkezten digu: TOLERANTZIA Erregre-sio-ekuazioaren parte diren aldagai askeen bitartez azaltzen ez den bariantzaren portzentaia bezala defi-ni dezakegu aldagai aske baten tolerantzia. Jada barnean dauden aldagaiek eta barnean hartuko dugunak,aldagai askearen aldaketen zati ezberdinak azaltzea interesatzen zaigu, eta ondorioz, kasu bakoitzeantolerantzia 1en hurbilekoa izatea interesatzen zaigu. Honek, orain ekuazioan sartuko den eta lehendikdauden aldagaien artean erlaziorik ez dagoela adieraziko luke.

Tolerantziaren kalkulua erraza da: Tolerantzia = 1 - R21, bertan Ri barnean dauden eta orain sartuko

den aldagaien arteko korrelazio-koefizientea delarik.

Kasu honetan, Ri EUSKAMA eta INGELES aldagaien arteko korrelazio-koefizientearen balioa izangoda: .0277. Beraz, INGELES aldagaiaren tolerantziaren balioa horrela lortuko dugu: 1-R2

1 = 1 - 0.02772 =0.9992. SPSSWINeko emaitzetan azken hamarrenean desfase txiki bat dagoela ikusten dugu. Ez du axola.Aurrera.

Tolerantzia 0.999032 da eta balio hau zorizkoa izateko probabilitatea, berriz, 0.0000; honekin ekua-zioan sartzea arrazoituta dago. Hurrengo etapan egiten da hau, eta bertakoak dira orain aurkezten dizki-zudan emaitzak.

2. etapa

Variable(s) Entered on Step Number

2. INGELES

Multiple R ,62032

R Square ,38479

Adjusted R Square ,38056

Standard Error 12,22970

Analysis of Variance

DF Sum of Squares Mean Square

Regression 2 27222,56461 13611,28230

Residual 291 43523,57485 149,56555

F = 91,00546 Signif F = ,0000

------------------ Variables in the Equation ------------------

Variable B SE B Beta T Sig T

EUSKAMA 8,974330 ,817248 ,505153 10,981 ,0000

INGELES ,810311 ,099117 ,376076 8,175 ,0000

(Constant) 22,676125 3,342144 6,785 ,0000

------------- Variables not in the Equation -------------

Variable Beta In Partial Min Toler T Sig T

RAVEN ,177839 ,210775 ,863929 3,672 ,0003

OHITURA1 -,126788 - ,058176 ,129525 -,992 ,3218

LENGUA ,195926 ,202699 ,658480 3,525 ,0005

330

Page 343: Estatistika teoria eta praktika SPSSWIN erabiliz

Eman diren aldaketak deskribatuko ditut labur.

INGELES aldagaia ereduko parte izatera iritsi da. Honek, jada zegoenarekin (EUSKAMA) batera, 0.62korrelazio anizkoitzeko koefizientea du, eta horren ondorioz determinazio-koefizientea 0.38479raino igoda. Doituta 0.38056 da, eta errore estandarra 12.22raino jaisten da.

Segidan, bariantzaren analisiko blokea dator. Hondar-distantzien batura murriztu egiten da, azalduta-ko bariantzaren batura igo egin delako. Noski! R2 igo denez, azaldutako bariantzaren portzentaia ere han-ditu egiten da.

Gero, erregresio-ekuazioa aurkezten digu:

EUSKTOT = 22.67 + 8.97 * EUSKAMA + 0.81 * INGELES

INGELES aldagaia ekuazioaren parte izatera sartu denez, logikoki, koefizienteak aldatu egin zaizkit.Hau, etengabeko prozesua izango da.

Erregresio-ekuazioarekin batera koefizienteen adierazgarritasuna aurkezten digu: 0.0000 kasu guztie-tan. Emaitza hauek zoriz izateko probabilitatea hori da; beraz, eredua justifikatuta dago.

Azkenik, ekuazioan ez dauden aldagaien emaitzak aurkezten dizkigu. Zein da ereduan egon litekeenhurrengoa? Zeinek du korrelazio-koefiziente partzialik handiena? RAVEN da hau eta Betaren balioa.177839 izanik, ondoren aurkezten ditudan hirugarren etapako balioetan sartzen zaigu.

3. etapa

Variable(s) Entered on Step Number

3. RAVEN

Multiple R ,64197

R Square ,41212

Adjusted R Square ,40604

Standard Error 11,97555

Analysis of Variance

DF Sum of Squares Mean Square

Regression 3 29156,15263 9718,71754

Residual 290 41589,98683 143,41375

F = 67,76699 Signif F = ,0000

-—-—-—-—-—-—-—-—-— Variables in the Equation -—-—-—-—-—-—-—-—-—

Variable B SE B Beta T Sig T

RAVEN ,533239 ,145223 ,177839 3,672 ,0003

EUSKAMA 8,856494 ,800907 ,498520 11,058 ,0000

INGELES ,669379 ,104371 ,310668 6,413 ,0000

(Constant) -,641105 7,143955 -,090 ,9286

-—-—-—-—-—-—- Variables not in the Equation -—-—-—-—-—-—-

Variable Beta In Partial Min Toler T Sig T

OHITURA1 -,183180 -,085389 ,127743 -1,457 ,1462

LENGUA ,157139 ,161777 ,623087 2,787 ,0057

331Erregresio anizkoitza

Page 344: Estatistika teoria eta praktika SPSSWIN erabiliz

Korrelazio anizkoitzeko koefizientearen balioa handitzen doa; orain 0.64197 balio du, determinazio--koefizienteak 0.41212, eta doituak 0.40604. Bitartean, errore estandarra proportzio berean jaitsi da:11.9755.

Ondoren bariantzaren analisia aurkezten digu, bertan erregresioaren bitartez azaldutako koadroenbatura ere handitu egin dela ikus dezakegu.

Erregresioaren ekuazio berria hau da:

EUSKTOT = -0.64 + 8.85 * EUSKAMA + 0.66 * INGELES + 0.53 * RAVEN

Ekuazioan ez dauden aldagaien artetik korrelazio-koefiziente partzialik handiena duena LENGUA da:0.16177. Bere tolerantzia 0.62 da; honek zera esan nahi du: 1 baliorako falta den gainerakoa (0.38), jadabarnean dauden aldagai askeekin konpartitzen duen bariantzaren zatia dela. Edonola ere, ekuaziora lau-garren etapan iritsiko da T-ren adierazgarritasuna 0.05 baino txikiagoa baita, hau da, ekuazioan sartzekomaximo bezala ezarri dugun PINa baino txikiagoa.

Laugarren eta azken etapako emaitzak hauek dira:

4. etapa

Variable(s) Entered on Step Number

4. LENGUA

Multiple R ,65384

R Square ,42751

Adjusted R Square ,41959

Standard Error 11,83823

Analysis of Variance

DF Sum of Squares Mean Square

Regression 4 30244,63150 7561,15788

Residual 289 40501,50796 140,14363

F = 53,95292 Signif F = ,0000

-—-—-—-—-—-—-—-—-— Variables in the Equation -—-—-—-—-—-—-—-—-—

Variable B SE B Beta T Sig T

RAVEN ,437886 ,147579 ,146038 2,967 ,0033

EUSKAMA 9,319265 ,808949 ,524569 11,520 ,0000

LENGUA ,313864 ,112621 ,157139 2,787 ,0057

INGELES ,505765 ,118708 ,234732 4,261 ,0000

(Constant) -5,428550 7,267964 -,747 ,4557

-—-—-—-—-—-—- Variables not in the Equation -—-—-—-—-—-—-

Variable Beta In Partial Min Toler T Sig T

OHITURA1 -,151191 -,071087 ,118575 -1,209 ,2275

End Block Number 1 PIN = ,050 Limits reached.

332

Page 345: Estatistika teoria eta praktika SPSSWIN erabiliz

Jada, analisiaren amaierara iritsi gara. Hauek azken etapako emaitzak dira, oraindik ekuaziora iritsi ezden OHITURA1 aldagaiak, 0.05 baino adierazgarritasun handiagoa baitu. Korrelazio partzialeko koefi-zientearen balio baxuan fijatu behar dugu. Oraindik azaldu gabe dagoen EUSKTOT aldagaiaren barian-tzako zatiari buruzko azalpen garrantzitsurik ez digu emango. Modu berean, tolerantzia ere oso baxuada. Noski, aldagai honek INGELES-ekin duen erlazioa 0.9109 da, beraz OHITURA1-ek azaldu beharzuen zatia, ekuazioan zegoen INGELES-ek azaldua du jada aurreragoko fase batean.

Aurreko guztia honela adierazi digu:

End Block Number 1 PIN = ,050 Limits reached.

Jarrai dezagun emaitzen azken laburpenarekin.

Azken korrelazio anizkoitzaren koefizientea 0.65384 da, determinazio-koefizientea 0.42751, etadeterminazio doitua 0.41959, errore estandarra 11.83823raino jaitsi den bitartean. Lau aldagaiekin EUSK-TOT aldagaiaren aldaketen % 41.959 azaltzea lortu dugu.

Azkenik, F-ren balioa 53.95292 da eta bere adierazgarritasuna .0000

Ereduko behin betiko erregresio-ekuazioa hau izango da:

EUSKTOT = -0.52 + 9.31 * EUSKAMA + 0.50 * INGELES + 0.43 * RAVEN + 0.31 * LENGUA

Ekuazio hau iragarpenak egiteko erabil dezakegu, baina ereduan hartu ditugun lau aldagaiekin EUSK-TOT aldagaiaren aldakortasunaren % 41.95 soilik azaltzen dugula gogoan izan behar dugu. Aldaketen %58.05 azaldu gabe dago, hau da, zati hau kontrolatu gabe dago. Honek, egin ditzaketen iragarpenakbaliogabeak izatera naramatza. Beraz, kontuz iragarpenak egiten saiatzeko unean! Maila honetakodeterminazio-koefizienteekin, Gizarte Zientziei Egokitutako Estatistikan hain ohizkoak direnekin behin-tzat, argi ibili beharra dago.

Ikus dezagun ondoren, SPSSWINek, emaitza hauek berak, nola aurkezten dizkigun 7.5 bertsioan.

Aurkezpen-formatoa nabarmenki aldatzen da, hala ere, orain arte esandako guztiak, bertsio honetanere balio osoa du; hau frogatuz joan zaitezke. Lan horretan, azalpen txikiak eginaz lagunduko dizut.

10.6.2. 7.5. bertsioko emaitzak

7.5 bertsioak emaitzak 7 taula jarraitan aurkezten dizkigu, bertan estatistiko ezberdinak aurkeztuz doala-rik. Baina taula bakoitzean, azken emaitzara iritsi aurretik, eginiko 4 etapenak aurkezten dizkigu. Etapabakoitzarentzat azaltzen dituen koefizienteak hauek dira:

1.- Korrelazio- eta determinazio-koefizienteak eta errore estandarrak.

2.- Bariantza baliokidearen analisiaren emaitzak.

3.- Erregresio-ekuazioaren koefizienteak.

4.- Ekuazioan oraindik integratu gabeko aldagaien estatistikoak.

5.- OUTLIERS, “arauditik kanpoko” kasuak. Taula hau lortzeko Erregresioko pantaila orokorrean,Estadísticos botoia sakatu ondoren, Diagnóstico por caso, aukeratu dugu.

6.- Aldagaien barneratze-ordena.

7.- Hondarren laburpena eta estatistikoak.

Emaitzen 7 tauletako bakoitza interpretatzeko erreferentzia txikiak emanaz joango natzaizu.

333Erregresio anizkoitza

Page 346: Estatistika teoria eta praktika SPSSWIN erabiliz

1 Taula.- Korrelazio- eta determinazio-koefizienteak eta errore estandarrak

Lehenengo zutabean (R) korrelazio anizkoitzeko koefizienteen emaitzak ditugu. Lehenik (lehenengoilara) aldagai bakar batekin (EUSKAMA), gero birekin, hirurekin eta laugarren ilaran, ekuazioaren parteizatera iritsi diren lauekin. Behealdean, a, b, c eta d letrekin, etapa bakoitzarentzako aldagai askeen (pre-dictors) zerrenda dago eta e epigrafean, menpeko aldagaiaren izena aurkezten digu. Hemen aldagaienbarneratze-ordena adierazi digu. Bigarren zutabean, determinazio-koefizienteen emaitzak azaltzen zaiz-kigu: R (R cuadrado). Aldagai askeak esplikatzen duen menpeko aldagaiaren aldaketen portzentaia aur-kezten du.

Hirugarren zutabean, determinazio-koefiziente doituaren emaitzak azaltzen zaizkigu (R cuadradocorregido). Determinazio-koefizienteak zoriak puztu litzazkeela eta zuzenketa koefiziente baten bitartezegitea komeni dela ikusi izan dugu lehen. Zuzenketa honen emaitza zutabe honetan agertzen da, ekua-zioan dauden aldagaiek esplikatzen duten bariantzaren portzentaia aztertzeko garaian, normalki erabil-tzen dena.

Azkenik, erregresio-ekuazio bakoitzarekin lan egitean eragindako errore estandarren emaitzak aur-kezten dizkigu (error típico de la estimación).

Koefiziente ezberdinak nola bilakatzen diren ikus dezagun:

Alde batetik korrelazioak, determinazioak eta determinazio doituaren koefizienteek, erlazioarentamaina adierazten digute, errore estandarrak errorearen tamaina zehazten digun bitartean. Hauek alde-rantzizko bilakaera dutela ikus dezakegu. Determinazio-koefizienteak gora egiten duenean, errore estan-darrak behera egiten du. Froga ezazu etapa bakoitzean errore estandarren karratua zati (1 – R2) beti kons-tantea dela. Konstante hau Yren bariantzaren balioa da. (R2z: doitua da).

334

Modelo R Rcuadrado

Rcuadradocorregido

Error típ.de la

estimación

1234

,491a

,621b

,642c

,653d

,241,386,412,427

,239,381,406,419

13,535912,203711,955911,8287

a. Variables predictoras: (Constante), AMAREN EUSKARA-MAILAb. Variables predictoras: (Constante), AMAREN EUSKARA-MAILA, INGELESc. Variables predictoras: (Constante), AMAREN EUSKARA-MAILA, INGELES, RAVENd. Variables predictoras: (Constante), AMAREN EUSKARA-MAILA, INGELES, RAVEN, LENGUAe. Variable dependiente: EUSKTOT

Resumen del modeloe

Page 347: Estatistika teoria eta praktika SPSSWIN erabiliz

2. Taula.- Bariantza baliokidearen analisiaren emaitzak

Taula honetan, erregresio-ekuazio desberdinei elkartutako edo asoziatutako bariantza-analisiarenemaitzak aurkeztu dizkigu. Planteamendu orokorra ondorengoa da: menpeko aldagaiak aldakortasun batdauka, hau da, elementu batetik bestera aldatzen da. Aldaketa hauek, edo aldaketa hauen arrazoiak azal-du nahi dira.

Lehenengo galdera: Zenbat igotzen dira azaldu nahi ditugun aldaketak? Distantzia karratuen baturaosoa da: 70285.242.

Etapa bakoitzean zenbat azaldu dugu? 16968.036 lehenengo etapan, 27095.637 bigarrengoan...

Esplikatu edo azaldu gabeko zenbat geratzen da etapa bakoitzean? 53317.207 lehenengo etapan,43189.605 bigarrengoan,...

Gutxitze honek badu bere zergatia: ondoren datozen kalkuluak egitean askatasun-graduen kopuruakontuan izaten duela (ekuazioan barneratutako aldagai-kopurua, eta datu askeen kopurua: 3tik 292askatasun-gradu totaletarainoko diferentzia).

Gero, Media cuadrática-ren zutabea lortzeko, Suma de cuadrados-eko balioak zati gl-koak egiten du.

Hemendik aurrera F-ren balioa lortzen du, Media cuadrática laukiko bi balioak zatituta. Eta eskuinal-deko zutabean, F horren balioa zoriz lortzeko probabilitatea (Sig.) aurkezten digu. Taula honen esanahiariburuz ez gara gehiago jardungo. Honen oinarri teorikoak aurreko gaian azter ditzakezu.

Hurrengo taulara pasako gara.

335Erregresio anizkoitza

Modelo glSuma decuadrados

a. Variables predictoras: (Constante), AMAREN EUSKARA-MAILAb. Variables predictoras: (Constante), AMAREN EUSKARA-MAILA, INGELESc. Variables predictoras: (Constante), AMAREN EUSKARA-MAILA, INGELES, RAVENd. Variables predictoras: (Constante), AMAREN EUSKARA-MAILA, INGELES, RAVEN, LENGUAe. Variable dependiente: EUSKTOT

ANOVAe

Mediacuadrática F Sig.

RegresiónResidualTotal

,000a16968,03653317,20770285,242

1 1291292

16968,036183,221

92,610

RegresiónResidualTotal

,000b27095,63743189,60570285,242

2 2290292

13547,818148,930

90,968

RegresiónResidualTotal

,000c28974,62441310,61870285,242

3 3289292

9658,208142,943

67,567

RegresiónResidualTotal

,000d29989,00640296,23770285,242

4 4288292

7497,251 53,583

Page 348: Estatistika teoria eta praktika SPSSWIN erabiliz

3.Taula .- Erregresio-ekuazioaren koefizienteak.

Taula honetan erregresioko zuzenen (planoen) ekuazio ezberdinak aurkeztu dizkigu. Koefizienteaklehenengo zutabekoak dira (B).

Modu honetan idatz ditzakegu:

1.- EUSKTOT = 46.564 + 8.714 * AMAREN EUSKARA-MAILA

2.- EUSKTOT = 22.687 + 8.908 * AMAREN EUSKARA-MAILA + 0.816 INGELES

3.- EUSKTOT = - 0.314 + 8.798 * AMAREN EUSKARA-MAILA + 0.677 INGELES + 0.526 * RAVEN

4.- EUSKTOT = - 4.994+ 9.254 * AMAREN EUSKARA-MAILA + 0.517 INGELES + 0.517 * RAVEN ++ 0.304 * RAVEN

Bigarren zutabean, koefiziente bakoitzaren errore estandarrak azaltzen zaizkigu. Segidan, koefizienteestandarizatuak, ondoren koefiziente bakoitzari dagozkion t-ren balioak eta zoriz lortzeko probabilitate-ak aurkezteko. Irakurleak interesik izango balu, aurreko orrialdeetara jo dezake, bertan koefiziente haue-tako bakoitzaren esanahia aztertzeko.

Hurrengo taula.

336

B Error típ. Beta

t Sig.

Coeficientesa

a. Variable dependiente: EUSKTOT

Coeficientes noestandarizados

Coeficientesestandarizados

46,564

8,71422,687

8,908,816

-,314

8,798,677

,526-4,994

9,254

,517,435

,304

1,836

,9053,335

,817,099

7,136

,801,104

,1457,271

,810

,119,147

,113

,491

,502,380

,496,315

,176

,522

,241,145

,153

25,369

9,6236,803

10,9088,246

-,044

10,9876,487

3,626-,687

11,423

4,3482,948

2,693

,000

,000,000

,000,000

,965

,000,000,000,493

,000

,000,003

,008

(Constante)

AMAREN EUSKARA-MAILA(Constante)

AMAREN EUSKARA-MAILA

INGELES(Constante)

AMAREN EUSKARA-MAILAINGELES

RAVEN

(Constante)AMAREN EUSKARA-MAILA

INGELESRAVEN

LENGUA

Modelo1

2

3

4

Page 349: Estatistika teoria eta praktika SPSSWIN erabiliz

4. Taula.- Oraindik ekuazioan barne hartu gabeko aldagaien estatistikoak.

Aurreneko taulan, korrelazio partzialeko koefizienteen balioak eta tolerantzia aurkezten dizkigu,hauek erabiliko baititu hurrengo etapan ekuazioan sartuko den aldagaia zein den erabakitzeko.

Zer dira korrelazio partzialeko koefizientea eta tolerantzia? Lehen azaldu da, gai honen lehen zatian,baina koefizienteen garrantzia dela eta, azalpen horren laburpen txiki bat berriz hemen egingo dut berrizhemen.

Korrelazio partzialeko koefizienteak, gutxienez hiru aldagai behar dituenak, bi aldagairen arteko erla-zioaren berri ematen du, erlazio horretatik hirugarren batek, edo gehiagok, sor lezakeen eragina suntsituz.

Zein zentzutan edo nola erabiliko dut korrelazio partzialeko koefizientea? Erregresio-ekuazioan alda-gai berri bat barneratzeko orduan menpeko aldagaitik azaldu gabe geratzen den zatiaren proportzio han-diena azaltzen duena izango da, ekuazioaren parte izan dadin interesatuko litzatekeena. Hau da, men-peko aldagaiaren azaldu gabeko zatiarekin erlazio handien daukana. Baina azaldu gabe geratzen denzatia, jada barnean daudenek azaldu ez dutena da, eta honek, barneratu gabeko aldagaiaren korrelaziopartzialeko koefizientea eta menpeko aldagaiaren artean koinziditzen ditu, jada ekuazioan dauden alda-gaien eragina suntsituz.

Koefiziente honi dagokion datua Correlación parcial-en zutabean agertzen da. Menpeko aldagaiare-kin korrelazio partzial handiagoa duen aldagaia, hurrengo fasean ekuazioan sartzen dela froga dezakezu.

Lehenengo etapan, korrelazio partzialeko koefizienterik handiena duen aldagaia zein da? INGELES.Hau izango da bada, hurrengo etapan sartuko dena. Zein koefiziente Betarekin sartuko da ekuazioan?.380 koefizientearekin.

Eskuinaldeko zutabean tolerantziaren emaitzak agertzen dira. Aldagai aske baten tolerantzia honeladefini genezake: jadanik erregresio-ekuazioaren parte diren aldagai askeek azaltzen ez duten, aldagaiaske horren bariantzaren portzentaia. Barnean dauden aldagaiek eta barneratuko ditugunek menpekoaldagaiaren aldaketen zati ezberdinak azaltzea interesatzen zaigu, kasu bakoitzean tolerantzia 1en aha-lik eta hurbilenekoa izatea komeni zaigularik. Honek, barneratuak dauden eta egongo diren aldagaienartean erlaziorik ez dagoela adieraziko liguke.

337Erregresio anizkoitza

Modelo

t Sig.Tolerancia

Variables excluidase

,319a

,380a

,292a

,349a

-,146b

,176b

,191b

-,193c

,153c

-,160d

1

2

3

4

OHITURA1

INGELES

RAVEN

LENGUA

OHITURA1

RAVEN

LENGUA

OHITURA1

LENGUA

OHITURA1

6,685

8,246

6,060

7,296

-1,337

3,626

3,418

-1,800

2,693

-1,487

,000

,000

,000

,000

,182

,000

,001

,073

,008

,138

,365

,436

,335

,394

-,078

,209

,197

-,105

,157

-,087

,994

,999

,999

,968

,177

,863

,655

,175

,620

,172

Correlaciónparcial

Estadísticosde

colinealidadBeta

dentro

a. Variables predictoras en el modelo: (Constante), AMAREN EUSKARA-MAILAb. Variables predictoras en el modelo: (Constante), AMAREN EUSKARA-MAILA, INGELESc. Variables predictoras en el modelo: (Constante), AMAREN EUSKARA-MAILA, INGELES, RAVENd. Variables predictoras en el modelo: (Constante), AMAREN EUSKARA-MAILA, INGELES, RAVEN, LENGUAe. Variable dependiente: EUSKTOT

Page 350: Estatistika teoria eta praktika SPSSWIN erabiliz

Tolerantziaren kalkulua erraza da: Tolerancia = 1 - R2i, non Ri barnean dagoen (edo dauden) eta bar-neratuko den aldagaien arteko korrelazio-koefizientea den.

Kasu honetan, Ri EUSKAMA eta INGELES aldagaien arteko korrelazio-koefizientearen balioa izangoda: .0277. Horregatik, INGELES aldagaiaren tolerantzia, horrela lortuko dugu: 1 - R2i = 1 - 0.02772 =0.999.

Hurrengo taulara pasako gara.

5. taula.- OUTLIERS. “Arauditik kanpoko” kasuak.

Taula honetan kasurik arraroenak aurkezten zaizkigu. Zer esan nahi du kasu “arraroak” testuinguruhonetan? Arauditik ateratzen dena da, erregresio zuzenetik oso urrun geratzen dena. Kasurik aldendue-nen edo urrutikoenen berri ematen digu, normalki emaitzak nahas ditzaketelako, eta, arraro bezala, azter-keta berezi eta zehatzago bat behar luketelako.

Gure kasuan, bi balore “arraro” edo “outlier” bezala aurkitu ditu. 39.a eta 174.a. Begira bi kasu haue-tan beren balioa EUSKTOT aldagaian, eta erregresioa erabiliz egindako aurresanen artean nolako dife-rentzi haundia dagoena (-45.03 eta -39.32). Horregatik jaso dute “outlier” izena.

Erregresio-analisia, oraingoz, kasu-kopuruarekin identifikatzera mugatzen da. Orain, bere azterketakestatistikaren helburuetatik ihesi egiten du, eta profesional/ikertzailearen zeregina izan behar du.Estatistikoki ere sakon liteke azterketa hau, baina hori, liburu honen helburuetatik at dago.

Jarrai dezagun.

6. taula.- Aldagaien barneratze-ordena.

338

EUSKTOT Residual

Diagnósticos por caso a

a. Variable dependiente: EUSKTOT

Númerode caso

Residuotip.

Valorpronosticado

39

174

-3,807

-3,325

27,00

29,00

72,0334

68,3256

-45,0334

-39,3256

AMAREN EUSKARA

MAILA

INGELES

RAVEN

LENGUA

Modelo

1

2

3

4

Variables

introducidas

Variables

eliminadasMétodo

Variables introducidas/eliminadasa

a. Variable dependiente: EUSKTOT

,Por pasos (criterio: Probabilidad de F para entrar<=, 050, Probabilidad de F para salir >=, 100)

,Por pasos (criterio: Probabilidad de F para entrar<=, 050, Probabilidad de F para salir >=, 100)

,Por pasos (criterio: Probabilidad de F para entrar<=, 050, Probabilidad de F para salir >=, 100)

,Por pasos (criterio: Probabilidad de F para entrar<=, 050, Probabilidad de F para salir >=, 100)

Page 351: Estatistika teoria eta praktika SPSSWIN erabiliz

Taula honetan aldagaien barneratze-ordena aurkezten digu. Egia da jadanik badakigula, baina bada--ezpada, SPSSWINek aurkeztu egiten digu, eta nik kontatu egiten dizut. Interpretatzeko erraza da behin-tzat, eta hori gure animoak eusteko oso lagungarria da. Abantailatxoren bat izan behar noizbait!

Eta, azkenengoa.

7. taula.- Hondarren laburpen eta estatistikoak.

Hondarren laburpen-taula honekin, 7.5 bertsioko emaitzen aurkezpena bukatzen da.

5 estatistiko aurkezten dizkigula ikusten dugu: txikiena, handiena, batezbestekoa, desbideratze tipikoaeta datu-kopurua, erregresio-ekuaziotik abiatuz lortu ditugun 4 balioentzat: balio aurresanak, hondarre-koak (EUSKTOT menpeko aldagaiaren balioa eta aldagai horrentzat erregresio-ekuazioak egin duenaurresanaren arteko diferentzia). Bi balio hauei balio tipifikatuak gehitzen dizkio.

Azken aipamen bat. Emaitzak aurkezteko garaian, analisi honetan zehazki eta ia guztietan orokorre-an, SPSSWINek informazio-kopuru izugarria eskaintzen digula frogatu ahal izan duzu. Zenbaitetan infor-mazio honek piska bat despista gaitzake. Aztertzailearen helburua, kasu bakoitzean hodei-puntua modugarbian ikusten lagunduko duen, balio/estatistikoen konbinaketa hautatzea da. Gai honetan bereziki, etaliburu osoan oro har, horretan lagungarri suertatu izana espero dut.

339Erregresio anizkoitza

Valor pronosticado

Residual

Valor pronosticado tip.

Residuo tip.

Mínimo Máximo MediaDesviación

típ.N

Estadísticos sobre los residuosa

a. Variable dependiente: EUSKTOT

38,4681

-45,0334

-2,372

-3,807

86,9844

24,0816

2,416

2,036

62,4811

-4,91E-02

-,002

-,004

10,1253

11,7575

,999

,994

294

294

294

294

Page 352: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 353: Estatistika teoria eta praktika SPSSWIN erabiliz

11. SPSSWIN 7.5 BERTSIOA

11.1. SPSSWINEKIN EGINIKO DATU-ANALISI BATEN ETAPAK

11.1.1. Datuak SPSSn sartu

11.1.2. Prozedura bat aukeratu

11.1.3. Analisirako aldagaiak aukeratu

11.1.4. Prozedura exekutatu

11.2. DATU-FITXATEGI BATEN SORRERA. ALDAGIEN DEFINIZIOA. DATUAK SARTZEA

11.2.1. Aldagaiaren izena

11.2.2. Aldagai-mota (Tipo)

11.2.3. Etiketak (Etiquetas)

11.2.4. Balio galduak (Valores perdidos)

11.2.5. Zutabe-formatoa (Formato de columna)

11.2.6. Datuak sartzea

11.3. SPSSWIN 7.5EKO LAGUNTZA-MOTAK

11.3.1. Laguntza-menua

11.3.2. Laguntza elkarrizketa-koadroetan

11.3.3. Beste laguntza bat elkarrizketa-koadroetan

11.3.4. Emaitzak

11.4. DATUEN EDIZIOA

11.4.1. Balio bat aldatu edo ordezkatu

11.4.2. Aldagai baten definizioa aldatu

11.4.3. Kasu bat gehitu

11.4.4. Aldagai bat gehitu

11.4.5. Datuak ezabatu

11.4.6. Aldagaiak ezabatu

11.4.7. Azken ekintza desegin

11.4.8. Datu bat bilatu

11.4.9. Kasu batera joan

11.4.10. Bi artxibo elkartu

11.4.10.1. Kasu gehiago. 2 fitxategi bat egin

11.4.10.2. Aldagai gehiago. 2 fitxategiak bat egin

11.5. DATUEN ERALDAKETA

11.5.1. Aldagai berrien sorrera eta kalkulua

11.5.2. Aldagaia kalkulatu: Baldin... (Si los casos...)

11.5.3. Balioen berkodetzea

11.6 KASUEN AUKERAKETA

11.6.1. Kasuen zorizko lagin baten aukeraketa

11.6.2. Artxiboa segmentatu edo banatu

11.7. EMAITZEN FITXATEGIAK

11.7.1. Imprimir

11.7.2. Fitxategi batean kopiatu. (GUARDAR COMO…)

11.7.3. SPSSWINeko emaitzak testu-prozesatzaile batean (WORD) nola sartu

Page 354: Estatistika teoria eta praktika SPSSWIN erabiliz
Page 355: Estatistika teoria eta praktika SPSSWIN erabiliz

343

11. SPSSWIN 7.5 BERTSIOA

Ordenadore pertsonalen erabilera hedatuak eta estatistikako programa-paketeen agerpenak estatistikanlan egiteko modua goitik behera aldatu dute, batik bat indize estatistiko ezberdinak lortzeko modua izu-garri erraztu dutelako.

Pakete estatistikoen artetik, erabilienetako bat SPSS da.

Urteetan zehar honen bertsio ezberdinak agertu dira. 1997. urtearen amaieran 7.5 bertsioa azaldu daWindows 95ekin lan egiteko prestatua.

Emaitzak gaztelaniaz aurkezten dituen lehen bertsioa da hau. Hots, analisien eta balio estatistikoezberdinen izenburuak gaztelaniaz daude. Era berean, pantailetako menu ezberdinak ere gaztelaniaz ida-tziak azaltzen dira, aurreko bertsioekin gertatzen zen gauza bera.

Windowseko aurreko bertsioak erabilpen eta interpretazio errazekoak ziren. Honetan, gauzak are erra-zagoak dira.

Emaitzak gaztelaniaz aurkezten dituen lehenengo bertsioa izateaz gain, bertsio honek beste abantailabatzuk ere eskaintzen ditu, hala nola emaitzen nabigatzailea edota bizkortasun handiko grafikoak.

Bertsio honen beste berrikuntza handi bat Aholkulari estatistikoa da. Honek, oinarrizko moduluanbarne hartutako teknika estatistikoen erabilpena eta lan egiteko modua azaltzen dizkigu. Elkarreragileada, eta galdera eta erantzunen bidez, guri zein analisi estatistikoa komeni zaigun erantzunez bukatzendu.

SPSSWIN 7.5ekin egingo dituzun lehenengo lanetarako, oso interesgarriak dira eskaintzen dituenlaguntza-mota ezberdinak, eta topatuko dituzun trabetatik ateratzeko baliagarriak izan daitezke.

Gai honetan, SPSSWIN 7.51 bertsioarekin lan egiteko modua aurkeztean, irakurleak Windows ingu-ruan lan egiteko oinarrizko moduak ezagutzen dituela suposatuko dut. Hau da, saguarekin, menu etaelkarrizketa-koadroekin, e.a.. lan egiteko modua ezagutzen duela.

Pakete honek eskaintzen duen guztia gai honetan biltzea ezinezkoa da. Helburua ez da SPSSWINprograma-paketearen ESKULIBURUA izatea. Bertan, programarekin lan egiteko pauso garrantzitsuenakbakarrik emango ditut, oinarrizko zatietara mugatuz. Hala ere, gai honetan eskaintzen dizudan informa-zioa SPSSWIN erabiltzeko gehienentzat aski izan daitekeela pentsatzen dut, edota gutxienez... asmohorrekin planteatu dut gaia.

Paketearen azterketa sakonagoa egiteko irakurlea eskuliburuetara igortzen dut, beste zenbait produk-tu informatikoren eskuliburuak ez bezala hauek eskuragarri, irakurterraz eta erabilgarri baitira. Programakberak pantailan eskaintzen digun (eta inprima daitekeen) laguntza-menuak erabiltzea litzateke besteaukera bat. Laguntza hauen erabilpena dagokion atalean azaltzen dizut.

Aurrera egin aurretik, ezagunak izan arren, bi gauzatxo azpimarratu nahi nituzke.

Lehenengoa, Windowsen eman beharreko pausoak aurkezteko moduari dagokio. Adibidez, progra-maren pantaila zehatz batean Estadísticos menura, hemen Resumir hautatu, eta ondoren Frecuenciashautatu behar dudala adierazteko, honako hauxe idatzi baino ez dut:

EstadísticosResumir

Frecuencias...

1 7.5 bertsioarekin lan egiteko modua aurkeztuko dut. Hala ere, Windows-eko aurreko bertsioen oso antzera lan egiten da.Leihoetan diseinu-diferentziak badira, baina funtsezkoenak ez du aldaketarik. Beraz, pakete honetako aurreko bertsiorikbaduzu, gai honetako azalpenak ere baliagarriak suertatuko zaizkizu.

Page 356: Estatistika teoria eta praktika SPSSWIN erabiliz

Bigarrengoa, aldagaiak edota elementuen zerrendak hautatzeko moduari dagokio.

Aldagaien zerrenda luze bat hautatzeko prozesurik errazena hau da: lehenengoa hautatu, gaineankokatu eta saguaren ezkerraldeko botoia sakatuz, ezkerraldeko botoia askatu eta lehenengo aldagaiahautatua geratuko zait. Azkenengora joan eta Letra larrien (Maiuskulen) tekla sakatua mantenduz sagua-ren ezkerraldeko botoia sakatuko dut, TARTEKO ALDAGAI GUZTIAK ERE HAUTATUAK GERATUKODIRELARIK. Honelaxe:

Elkarren segidakoak ez diren zenbait aldagai hautatzeko modua hauxe da: saguaren ezkerraldekobotoiarekin lehenengoa hautatuko dut, eta gainerakoak ere saguaren ezkerraldeko botoiarekin hautatukoditut, baina CTRL tekla sakatuta mantenduz. Emaitza honakoa da:

Zure ordenadorean paketea ondo instalatua duzula pentsatuko dut. Horretarako, gutxienez, Pentiumprozesadorea (edo 486 floating-point) duen ordenadore batean 50 Mega aske, 8 megako minimo bat(gomendagarria 16koa da), eta pantaila grafikoa beharko zenituzke. WINDOWS NT 3.5.1 bertsioa dutenordenadoreetan ere erabili dezakezu.

Edonola ere, paketearen instalazioak ez du arazorik sortzen. Windows 95eko produktu informatikoenohizko instalazioa da. Behin CD-ROMa, edo 1 disketea sartu ondoren, Inicio-ko menua irekitzen dut;Ejecutar hautatu eta leihoan hau idatziko dut: A:/setup.exe (intro). Eta instalazio-prozesua hasten da.Hurrengo pantailek eskaintzen dizkiguten elkarrizketekin, paketea arrakastatsu instalatuko dugu.

Jadanik programa instalatua dugu. Paketearekin lanean has gaitezke.

Eta ni, besterik gabe, SPSSWIN 7.5ekin lan egiteko modua deskribatzen hasiko naiz. Deskribapen hau,ondorengo 7 ataletan banatuko dut.

344

Page 357: Estatistika teoria eta praktika SPSSWIN erabiliz

1.- SPSSWINekin eginiko datu-analisi baten etapak. Argiago ikusteko adibide sinple baten garapen osoa-rekin laguntzen dut.

2.- Datu-fitxategi baten sorrera. ALDAGAIEN DEFINIZIOA. Datuak sartzea.

3.- LAGUNTZA-MENUAK. Fase ezberdinetan zehar, labur deskribatzen dizkizudan laguntzeko moduezberdinak eskaintzen ditu SPSSWINek.

4.- DATUEN EDIZIOA, datu-fitxategiaren EDIZIOA/ALDAKETA. Zenbaitetan, jada artxibatua dugun datu--fitxategian aldaketak egin beharko ditugu: aldagaiak gehitu, datuak gehitu, aldatu...

5.- Datuen eraldaketa eta sorrera.

6.- Datuen aukeratze eta segmentazioa.

7.- Emaitzekin lan egitea.

11.1. SPSSWINEKIN EGINIKO DATU-ANALISI BATEN ETAPAK

SPSSWINekin datu-analisi bat burutu ahal izateko, oinarrizko lau pauso eman behar ditugu.

1.- Datuak SPSS-n sartu. Datu batzuk sartu, edo lehendik sartuta baditugu zein datu-multzo (fitxategi)analizatu nahi dugun esan behar diogu. Normalki SPSSWINekin analizatzeko prestatutako datu-fitxa-tegiei .SAV amaiera gehituko diegu.

2.- Prozedura bat aukeratu, zein fitxategi analizatu nahi dugun baldin badakigu. Orain zein analisi-motaegin nahi dugun zehaztu beharko dugu. Estatistiko edo grafikoetako baten artean hautatu eta zehaztubeharko dugu.

3.- Analisirako aldagaiak aukeratu, zein datu nahi ditudan eta zein froga edo grafiko burutu nahi dudanbaldin badakit. Orain aztertu nahi ditudan aldagaiak zehazki zein diren paketeari adierazi beharkodiot.

4.- Prozedura exekutatu; analisiak edo grafikoa egin, eta emaitzak ikusi.

Pauso hauetako bakoitzerako, SPSSWINek pantaila-mota ezberdinak aurkezten dizkigu. Guztien ar-tean, badago bat, datuen editorea edo lehio nagusia deritzona. Etengabe gure erreferentzia-puntuaizango da eta orain deskribatuko dugu.

345SPSSWIN 7.5 bertsioa

aktibatutakoaldagaia etaelementua

datu-fitxategianmugitzeko…

datu-fitxategiarenizena

Laguntza eskatzekoikurra

Aldagaien izenakikonoak

Page 358: Estatistika teoria eta praktika SPSSWIN erabiliz

Bertan, oso baliagarri izango zaizkigun atal ezberdinak nabarmendu ditut.

1.- Datu-fitxategiaren izena. Goialdeko ezker-angeluan.

2.- Aldagaien izenak.

3.- Laguntza eskatzeko ikurra. Honekin, programari buruzko laguntza-mota asko lortu ahal izango dut.

4.- Aktibatutako laukia. Aldagaiaren izena eta aktibatutako laukiaren subjektu-kopurua.

5.- Ikono ezberdinak. Beraien gainetik pasatzean, pantailaren behealdean azaltzen diren etiketak aktiba-tzen zaizkit.

6.- Desplazamendu-barrak. Datu-fitxategia gora eta behera, edo ezker eta eskuinera mugitzeko.

LIBURU.SAV datu-fitxategiaren izenaren azpian, errotulu ezberdinak azaltzen direla ere kontuan izanbehar dugu: Archivo, Edición, Ver... Hauetako bakoitzak aukera ezberdinak eskaintzen dituen menu batzabaltzen du. Adibidez, Datos-ek... aldagaiak, plantilak edota datuak definitzen uzten du. Hauek kurtso-rea beregana eraman eta klik eginaz ikus ditzakezu.

Behealdean, funtzio zehatzetarako sarrera errazten duten ikonoak azaltzen zaizkigu. Hauetara zabal-tzen diren menuetatik ere sar zaitezke.

Ez da pantaila-eredu bakarra. Gai honetan zehar beste batzuk ere ikusiko ditugu.

Orain, adibide erraz bat garatuz has gaitezen.

Lehen adibidea

SPSSWIN erabiltzen duzun lehenengo aldia dela suposatzen dut, bere gelako haurren ikerketa erraz bategin nahi lukeen adibideko Eli andereñoa bezala, hain zuzen ere.

Elik haurren MUSIKAKO notak aztertu nahi ditu. Horretarako, WINdowseko SPSSren, 7.5 bertsioa ins-talatua duen ordenadore bat dauka. SPSSWINekin ez du inoiz lanik egin, WINDOWS 95 zertxobait eza-gutzen badu ere.

Ordenadorea piztu du. Aurrean pantaila bat dauka eta bertan honen antzeko ikono bat aurkituko du,SPSSWINerako2 “Acceso Directo” edo Sarrera Zuzena deritzona.

Ikonoaren gainean kokatuta, ezkerreko botoiari egiozu klik bitan, eta egoki egin baduzu (bestela ekinberriro eta ez etsi, ikasiko duzu) SPSSWINeko hasierako lan-pantaila azalduko zaizu. Hauxe, hain zuzen.

346

2 Aurkitzen ez baduzu, eta Windows 95 pixka bat ezagutzen baduzu, MI PC ikonora jo ezazueta C diskoa hautatu. Hemen, programen karpetan, SPSSWIN izena duen fitxategia aurkitukoduzu, eta lasterbide bat eraikitzea izango da biderik egokiena.Ikonoa aurkitzen ez baduzu, eta Windows 95 ezagutzen ez baduzu, oraingoz eska iezaiozulaguntza zure lagunen bati, aurreko paragrafoan azaldu dizkizudan pausoak jarraituz estua-sunetik atera zaitzan. Bide batez, Windows 95-ekin lan egiten ikastearena pentsa ezazu(horretarako, adibidez, Elhuyar argitaletxeak argitaratutako Windows 95 nekerik gabe... libu-ruaz baliatuz).

Windows 3.1, 3.1.1 edo NT 3.5.1-ekin lan egiten baduzu, ordenadorea martxan jartzean hone-lako leihoa azalduko duen pantaila batekin egingo du topo. Eman beharreko pausoakWindows 95-arekin eman beharrekoen antzekoak dira.

Page 359: Estatistika teoria eta praktika SPSSWIN erabiliz

Datuen editore-pantaila da. Lehen ere ikusi dugu. Orain hutsik dago. Goialdean izenburua azaltzenda, “Sin título...”. Datuak sartzeko erabiliko dudan pantaila da hau. Has gaitezen.

11.1.1. Datuak SPSSWINen sartu

Kurtsorea 1. lerroan eta 1. zutabean kokatuko dugu, zati koadrikulatutako goi-ezkerraldean, aurreko pan-tailan azpimarratua agertzen dena. Eta besterik gabe lehenengo ikaslearen musikako nota idatz dezake-gu: 7. Intro sakatu.

Jarraian bi gauza gertatzen dira: lerroaren goiburuan var00001 errotulua eta lehenengo laukian 7,00balioa agertzen direla. Orain aurrekoaren azpian dagoen laukia geratzen da azpimarratua.

Dena ongi doa eta aurrera egiten dugu. Hurrengo datuak sartzen ditugu, pauso hauek emanez:

6 (intro) 4 (intro) 7 (intro) 9 (intro) 5 (intro) 4 (intro) 6 (intro) 8 (intro) 7 (intro) 8 (intro) 5 (intro)6 (intro) 3 (intro) 7 (intro) 4 (intro).

347SPSSWIN 7.5 bertsioa

Page 360: Estatistika teoria eta praktika SPSSWIN erabiliz

Azkenean honelako pantaila geratuko zaigu:

Edozein arrazoirengatik funtzionatzen ez badu, SPSSWINetik atera eta berriro has zaitez. Ateratzeko,pauso hauek eman:

ArchivoSalir de SPSS...

Programatik irteteko, WINDOWS 95eko beste ohizko era guztiek ere funtzionatuko dute.

Irten beharra izan baduzu, berriz sartu eta errepika itzazu aipatutako pauso guztiak. Lortuko duzu...(edo bestela, aldamenekoari galdetu).

Lehenengo fasea, datuak sartzea, osatua dugu jadanik. Goazen bigarrengora. Hemen zer egin nahidugun erabaki behar dugu. Demagun datu hauen Histograma, batezbestekoa eta desbideratze tipikoalortu nahi ditugula. Horretarako, prozedura egokia hautatu behar dugu. Hau da programari adierazi behardioguna: zer egin nahi dugun.

11.1.2. Prozedura bat aukeratu

Histograma egiteko, pantaila nagusian azaltzen den Gráficos menuahautatu behar dugu. Hautatakoan, gainean sakatu eta eskuinean dau-kagun menu hau zabaltzen zaigu.

Hemen, gotiki behera eginda, hamaikagarren tokian Histogramaazaltzen da. Bere gainean kokatuko eta saguaren ezkerreko botoiasakatuta ondorengo orrialdeko pantaila azalduko zait.

348

Page 361: Estatistika teoria eta praktika SPSSWIN erabiliz

Programak orain badaki zer nahi dudan.

11.1.3. Analisirako aldagaiak aukeratu

Aldagai bakarra dugunez, musikako notak, ez dago arazo handiegirik. Datu-zutabe bakarreko aldagaia-ren izena azpimarratua agertzen da: var00001. Bere eskuinaldean lauki zuri bat agertzen da; hautatuta-ko aldagaia kokatuko den lekua da hau.

Nola hautatuko dugu? Oso erraz. Ezkerraldeko blokean aldagaia azpimarratua dagoenean, eskuinal-derako norabidean dagoen gezia duen botoia sakatzea aski dugu, eta klik, aldagaiak eskuinaldeko laukizuriaren lekua beteko du. Egin proba.

Honenbestez, azken fasea baino ez zaigu falta.

11.1.4. Prozedura exekutatu

Arazorik ez dago; goi-eskuinaldean azaltzen den “Aceptar” botoia sakatzea aski da. Sakatu. Une batezpantaila hau desagertu eta Datos-ekoa azaltzen dela ikusiko duzu, prozesadorea funtzionatzen hastendela igartzen duzunarekin batera. Kalkuluak egiten ari da. Makinaren abiaduraren arabera denbora gutxi,edo oso gutxi, itxaron beharko duzu, eta ondorengo pantaila lortuko duzu.

349SPSSWIN 7.5 bertsioa

Page 362: Estatistika teoria eta praktika SPSSWIN erabiliz

Zorionak!! Lortu dituzu lehen emaitzak SPSSWINekin.

Orain, emaitza hauekin nahi duzuna egin dezakezu: inprimatu, pantailan ikusi, aztertu, markoan ipini,ezabatu... Esango dizut hau nola egin (beno, markoan ipintzea niri ez zait batere ongi ateratzen).

Sarrera txiki hau erraza egingo zitzaizulakoan nago.

Lehen froga hau amaitu dugu, baina... kontuz! Ez galdu! Hau emaitzen leihoa da eta datuen editore--pantailara itzuli behar duzu horretarako.

Zenbait bide dituzu horretarako.

“Navegador de resultados de SPSS” izeneko leiho hau itxi ezazu, pantailaren goi-eskuinaldean azal-tzen den gurutzean sakatuz.

Edo zuzenean, SPSSWINen ikurra azaltzen den eta ataza-barran “Sin título-Editor de..” izena dara-man botoian sakatu.

Edo “Archivo”ko menura joan, goi-ezkerraldean, “Archivo”ren gainean sakatu eta, menua zabaltzendenean, “Cerrar” aukera hauta ezazu. Kasu honetan “¿Desea guardar el contenido?” mezua azaldukozaizu eta hiru aukera ematen dizkizu: “Si”, “No” eta “Cancelar”. Lehenengo biek zer esan nahi dutenbadakizu, hirugarrenak, “Cancelar”ek, aurreko egoerara itzultzeko aukera ematen dizu. “Si” hautatzenbaduzu, izen bat ematea eskatuko dizu. Idatzi izena eta “guardar” sakatu. Bizkorragoa da “No” hauta-tzen baduzu, zuzenean nahi genuen lekuraino eramango baitzaitu: datuen editorera, SPSSWINen lehenpantailara.

350

Page 363: Estatistika teoria eta praktika SPSSWIN erabiliz

Orain prozesuarekin amaitu behar dugu. Programa itxi, eta ordenadorea itzali.

Baina... gure andereño Elik, bihar beste ikasgaietako datuak edo bere gelako 16 ikasleen ezaugarrizehatzak sartu beharra izan dezake. Horregatik, amaitu aurretik, pantailan tekleatu dituen musikako 16notak gordetzea interesatzen zaio, beste egun batean eskuratu ahal izateko.

Eman behar dituen pausoak ondorengoak dira:

ArchivoGuardar como...

Eta honako pantaila lortuko du, bertan gorde nahi den datu-fitxategiaren izena idatzita: MUSIKA.Guardar.

Laster amaituko da datuak gordetzeko prozesuarekin. Datu-editorearen pantailara itzul zaitez.Pantailaren goialdean eta behealdeko ataza-barran, MUSIKA izena azaltzen da.

Datuak gordeak daude eta bihar, berriro erabili ahal izango dira.

Ordenadorea itxiko dut; horretarako, Windows 95eko programa guztiekin bezala, goi-eskuialdekogurutzean (X) sakatu eta SPSSWINetik aterako naiz. Sistema itzal dezaket “Inicio” botoitik... Betikoa.

11.2. DATU-FITXATEGI BATEN SORRERA. ALDAGAIEN DEFINIZIOA. DATUAK SARTZEA

Programarekin izan duen lehen kontaktuaren emaitzarekin gustura dago Eli eta gaur datu gehiagorekinsaiatuko da. Gelako ikasleekin lan egiten interesatua dago. Ikasle bakoitzeko 6 datu jarri nahi ditu: izena,sexua, jaioteguna eta MUSIKA, GIMNASIA eta ESKULANETAKO notak. Honen antzeko taula bat osatunahi luke:

351SPSSWIN 7.5 bertsioa

Page 364: Estatistika teoria eta praktika SPSSWIN erabiliz

izena sexua jaioteguna musika gimnasia eskulanak

Agirre, A. neska 91-07-17 7 7 6

Alustiza, A. neska 91-10-01 6 8 5

Andres, E. neska ezezaguna 4 6 7

Cano, M. neska 91-07-06 8 4 8

Echaide, P. mutila ezezaguna 7 9 6

Egibar, N. mutila 91-09-22 9 8 7

Etxeberria, A. neska 91-02-11 7 5 5

Illarreta, I. mutila 91-10-30 6 6

Lizarbe, D. mutila 91-12-31 4 7 7

Mayoz, E. neska 91-11-06 9 5 8

Rodriguez, I. mutila 91-10-06 8 6

Romo, S. neska 91-06-10 7 8 8

Salaberria, I. mutila 91-02-08 6 4

Salazar, T. neska 91-03-16 8 9 6

Tejadas, I. mutila 91-01-04 9 8 7

Unamuno, A. neska 91-04-07 8 7 8

Ikus dezagun datu hauek sartzeko, zein den prozedura osoa eta zuzena. Baina hasi aurretik bizpahi-ru gauza aipatu nahi nituzke.

SPSSWINeko datuen taulak aurrekoetakoak bezalakoak dira:

.- Lerroak kasuak dira. Subjektu/elementu bakoitzaren datuak lerro batean.

.- Zutabeak aldagaiak dira.

.- Laukiek balioak dituzte.

.- Datu-fitxategiak errektangeluarrak dira. Adibidez, aurreko datu-taula, 16 x 6 -koa da lerro bakoi-tzean 6 balio dituelarik: 16 ikasle eta ikasle bakoitzaren 6 datu.

Datuak sartzeko garaian, SPSSWINek eskaintzen dituen zenbait aukera kontuan izatea garrantzitsuada, lana aurrezten lagunduko baitigute. Nire ustez garrantzitsuena, batez ere GAUZAK EZ KONPLIKA-TZEA DA.

Gogoan izan, datu-fitxategi bat sortzen ALDAGAIEN DEFINIZIOAREKIN hasten dela.

Aurreko adibidean aldagai bakar batekin lan egiten genuen eta datuak zuzenean sartzen genituen.Aldagai gehiagorekin lan egiten dugunean ALDAGAIAK DEFINITUZ hastea komeni da.

Aldagai baten definizioaren proze-suak 5 zati ditu. Zati hauek, datuen edi-zioko pantailan pauso hauek emanondoren lortuko dugun leihoan ikusditzakegu:

DatosDefinir variable...

352

Page 365: Estatistika teoria eta praktika SPSSWIN erabiliz

Zatiak hauek dira:

* Aldagaiari izen bat eman.

* Aldagai-mota definitzea (TIPO): numerikoa, data,...

* Etiketak (Etiquetas): aldagaiaren izenari eta honen balio ezberdinei etiketa bat eransten uzten digu.

* Galdutako balioak (Valores perdidos): Zenbaitetan subjekturen baten datuak ez ezagutzea gerta daki-guke. Adibidez, haur baten jaioteguna, edo ikasgairen bateko nota. Kasu hauetan, galdutako balioenadierazgarri diren balio bereziak erabil ditzakegu: VALORES PERDIDO .

* Zutabe-formatoa (formato de columna): Datuen edizio-pantailan zutabearen zabalera zehazteazgain, datuen lerrokatze-modua zehazteko aukera eskaintzen digu.

Ikus dezagun zati hauetako bakoitza.

11.2.1. Aldagaiaren izena

Hutsune honetan idatziko dugu.

Gehienez 8 karaktere izan ditzake eta letraz hasi behar du. Gainerantzeko karaktereak letrak edo zen-bakiak izan daitezke. Badira zenbait hitz-gako (gutxi) paketeak bere programazio-prozesuan erabiltzendituenak eta ondorioz, aldagaien izen bezala erabili ezin direnak.

Arazorik izan ez dezazun, aldagaia bera gogoraziko dizuten hitzak erabiltzea gomendatzen dizut.Adibidez: IZENA, MATEMATI, ADIMENA, MUSIKA, SEXUA, JAIOTEGU, ADINA...

Kontuz!, bi aldagairi izen bera jartzea ezinezkoa baita. Guretzat nahasketa-iturri izateaz gain, paketeaere asko nahastuko litzateke eta ez du uzten. Ez ezazu gauza zaildu karaktere arraroak jarriz ere.Harridura-zeinuak, asteriskoak, e.a. jartzea, nahasketa-iturrri izateaz gain, bat edo beste ez onartzea gertaliteke. Ez itzazu bazterrak nahastu eta gauzak erraz egiten saiatu!

Beste ohar txiki bat: SPSSWINek ez du letra larri eta xeheen arteko ezberdintasunik egiten, programa-rentzako guztiak berdinak dira. Aldagaien izenak aukeratzerakoan ere, izenak ez errepikatzeko, hau kon-tuan izan beharko duzu.

11.2.2. Aldagai-mota (TIPO)

8 aldagai-mota daude. Definir variables leihoko Tipo... botoian sakatzen baduzu, beste honekin egingoduzu topo.

353SPSSWIN 7.5 bertsioa

Page 366: Estatistika teoria eta praktika SPSSWIN erabiliz

Nire gomendioa ondorengo hiru hauekin bakarrik lan egitea da (gutxienez lehen egunetan). Aski dira;ez duzu gehiago beharko. Orain azalduko dizkizut.

Numerikoa. Balioak zenbaki edo numeroak dira. Kasu gehientsuenentzat balio du. Aurreko adibide-ko lau aldagaiekin tipo hau erabiliko dugu. Gorde nahi dugun zutabe-kopurua adierazi beharko diogu;baita hamarren-kopurua ere.

Ezer esaten ez badiogu, defektuz, 8 hutsune gordeko dizkigu bi hamarrenekin. Hamarrenak komatxobaten bidez bananduko ditut, honela: 45,20.

Katea: testua idazteko, ikasleen izena adibidez, erabiltzen da. Ez dira kalkuluetarako erabiltzen.Kontuz: era honetara definitzen baduzu zenbait analisi estatistiko egiteko arazoak izan ditzakezu.

Data: Datak sartzeko erabiltzen da, kasu honetan haurren jaioteguna. Puntu honetan, euskarazko dataez duela onartzen adierazi behar dizut: urtea, hilabetea eta eguna, alegia. Eskaintzen dizkidan moduezberdinen artean hautatu behar dut. Ematen dizkigun aukerak hauek dira:

Pantailan azpimarratua agertzen zaidan formatoa hautatzen badut, (dd-mmm-aaaa), nire alabarenjaioteguna, 1991ko otsailaren 11, honela idatzi ahal izango dut: 11-2-1991, eta SPSS-k 11-FEB-1991bezala onartuko dit. Aurrera. dd.mm.aa formatoa hautatzen badut, 11.2.91 idatzi beharko dut. Dudarikgabe, emaitza bera da. Azken hau izango da nik aurrerantzean erabiliko dudana.

11.2.3. Etiketak (Etiquetas)

Aldagaiaren izenari eta honen balio ezberdinei etiketa bat eransteko aukera ematen digu. Etiketen botoiasakatu eta pantaila hau agertuko zait:

Bi etiketa-mota daude.

354

Page 367: Estatistika teoria eta praktika SPSSWIN erabiliz

Aldagaien etiketak (Etiquetas de variable). Aldagaia edota aldagaiaren izena deskribatzeko erabilikodugu. Lehen, aldagai baten izenak 8 karaktere baino gehiago ezin dituela hartu adierazi dut. Etiketa hone-tan, berriz, 120 karakterekin deskribatzeko aukera dut. Gehitxo. SEXUA aldagaiaren etiketa bezala, IKAS-LEEN SEXUA idatzi dut.

Balioen etiketak (Etiquetas de valor): SEXUA aldagaiaren datuak sartzeko bi modu ditut, motza etaluzea. Luzea, aldi bakoitzean “neska” edo “mutila” idaztean datza. Motza, berriz, adibidez, “neska” bada1 idaztean eta “mutila” bada 2 idaztean datza.

Gomendatzen dizudan modu labur hau erabiltzen baduzu, balio bakoitzari zein kategoria esleitu dio-zun adierazi beharko duzu. Honela egingo duzu: Valor-en 1 idatzi, eta Etiqueta de valor-en, berriz,NESKA, eta Añadir sakatu. Aurreko leihoan ikus dezakezun bezala, honen behealdean zuk emandakoaginduaz SPSSWINek egiten duen interpretazioa azalduko zaizu, eta ongi edo gaizki dagoen frogatu ahalizango duzu. Orain hurrengo kategoriarekin segituko duzu. Valor: 2, Etiqueta de valor: MUTILA. Añadirsakatzen baduzu, behealdera pasako dizu, paketeak ulertu duen modua adieraziz. Amaitu duzu, laburra,sinplea, eta... denbora asko aurreztuko duzu. Gehien bat, aldagai KOALITATIBOENTZAT erabiltzen da.

Baina KONTUZ! SEXUA aldagaiaren datuak 1 eta 2 bezala sartu baditut eta gero, balioei etiketak eslei-tu badizkiet, datuen edizio-pantailan etiketak edo balioak azaltzea hauta dezaket. Horretarako datuenedizio-pantailan hurrengo botoia daukat.

11.2.4. Balio galduak (Valores perdidos)

Zer egingo dut pertsona baten sexua ezagutzen ez badut? Bi aukera ditut.

1.- Bete gabe uztea. Orduan, automatikoki, aldagai numerikoetan, programak komatxo bat jarriko dit,“Sistemaren balio galdua” deritzo.

2.- Aldagai baten balioa ez dut ezagutzen, baina balio bat emango diot, aurrerago, berarekin lan egin nahiizan dezakedalako. Hau egiten badut, programari posible ez den balio bat dela eta balio galdu batadierazteko erabili dudala aditzera ematea komeni zait.

Adibidez, MUSIKA, SOINKETA eta ESKULANen kasuan, 99 balioa galdua bezala erabil dezaket. Bainaesango beharko diot 99 balioa ez dela nota bat, galdutako balio bat izendatzeko baizik.

Honek zertarako balio du? Haurren bat gimnasiatik salbuetsita badago, adibidez, ez du notarik izan-go, baina ez azterketa egin ez duelako salbuetsita dagoelako baizik... Beste batzuetan, aldagai bateanbalioa ezezaguna duten subjektuak aztertzea interesatuko zait, edo botua nori eman zalantza dutenak,...Mota honetako balioak erabiltzea justifikatzen duten arrazoiak hamaika izan daitezke, batez ere, gerobalio hauekin beste era bateko tratamendu estatistikoak egitea posible izango delako.

Gure balio galduak adierazteko, honela egingo dut: aldagaia definitzeko leihoan, “Valores perdidos”botoia sakatu eta hurrengo pantaila agertuko zait, bertan “Valores perdidos discretos” aktibatu eta lehe-nengo laukian 99 idatziko dut.

355SPSSWIN 7.5 bertsioa

Page 368: Estatistika teoria eta praktika SPSSWIN erabiliz

KONTUZ! Balio galdu bat izendatzeko, aldagaiak har ditzazkeen balioetatik desberdina dena erabilibeharko duzu. Horrela, SEXUA aldagaia 1 eta 2 bezala kodifikatzen badugu, balio galdu bat izendatze-ko 3, 7, 8, e.a... erabiliko ditugu; baina inoiz ez 1 eta 2.

Eta beste gauza bat. Data aldagaiaren programak ez dit datuak galduak bezala definitzen uzten. Beraz,kasu hauetan posibilitate bakarra laukitxoa zuri uztea izango da.

11.2.5. Zutabe-formatoa (formato de columna)

Zenbat zutabe beharko ditut aldagaiaren datuak sartu eta ikusteko?

Zutabe-formatoak pantailan ikusiko ditugun zutabe-kopuruaren berri ematen digu.

Zutabe-formatoaren eta, aldagai-motan definitu dudan, zutabe-kopuruaren arteko oinarrizko desber-dintasuna hau da: zutabe-formatoak nik PANTAILAN IKUSIKO DUDANAREN berri baino ez dit ematen.Tipo Numéricoen zutabe-kopuruak, datuak idatziko ditudan formatoaren berri eta hamarren-kopuruarenberri ematen digu.

IZENA aldagaian 25ekin nahikoa izango da, notetan 2rekin aski da (gogoratu 10en bat egon litekeelaeta balio galduak adierazteko 99 erabiliko dudala). SEXUA-n 1ekin aski izango dut eta MUSIKA, GIM-NASIA,.. eta abarretan beste 2 aski izango dira. Baina SEXUA, MUSIKA, formatoetan 2ko luzapena ema-ten badiot, aldagai hauentzat 2 zutabe bakarrik erreserbatzen dituenez, berauen izenburuen errotuluan,SE, MU, GI. besterik ez dut ikusiko.

Pantaila honetan, nire datuak lerrokatzeko modua ere hautatu ahal izango dut, ezker, erdi edo eskui-naldean. Nik behealdeko leihoan definitua dudan aldagaian, 8 zutabe gorde ditut aldagaiarentzat, etalerroka diezazkidala balioak eskuinaldean (ohizkoena). Zutabe-formatoak Aldagai Motan esan diodandigito (zutabe) kopuru berdinekoa edo gehiagokoa izan behar du.

356

Page 369: Estatistika teoria eta praktika SPSSWIN erabiliz

Adibide praktikoa

Ikus dezagun SPSSWINekin sartu eta aztertu nahi ditudan 6 aldagaien datuekin, hemen definitu ditudan5 pausoak nola eramaten ditugun praktikara.

Goazen bada.

* Aldagaiari izen bat eman. Gehienez 8 karaktere. Hauek izan daitezke: IZENA, JAIOTEGU, SEXUA,MUSIKA, GIMNASIA eta ESKULAN. Zera, letra larri eta xeheen arteko ezberdintasunik ez duela egi-ten gogorarazten dizut.

* Aldagai-mota definitu.

IZENA katezkoa edo “de cadena”koa da. Haurren izenak dira.

JAIOTEGU datakoa da, eta dd.mm.aa,... hautatzen dut. Beraz, 1991. eko otsailaren 11 honela idatzi-ko dut: 11.02.91

Gainerantzekoak numeriko edo zenbakizkoak dira. Sexuan 1eko zabalera eta hamarrenak 0 adierazi-ko diot. MUSIKA, GIMNASIA eta ESKULAN-en zabalera 2, eta hamarrenak 0. (Gogoan izan 10en bategon litekeela eta balio galduentzat 99 balioa erabili izan dugula).

* Etiketak. Kasu honetan aldagaien izenak oso argiak dira. Ez dago nahasteko aukerarik, eta ez du penamerezi aldagaien balioei etiketarik jartzea. Ordea SEXUA aldagaiaren balioei etiketak jarri beharkodizkiet. 1: “NESKA”, 2: “MUTILA”. Prozedura atzerago azaldu dizudana da. Beste aldagaietan etike-tak definitzen denbora pasatzerik ez du pena merezi.

* Balio galduak: Balio galduak JAIOTEGU, MUSIKA, GIMNASIA eta ESKULAN aldagaietan dauzkat.JAIOTEGU-ren kasuan, DATA edo FECHA motakoa izatean, ezin dut nik galdua bezalako balio batdefinitu. Dagokion laukia zurian uztea besterik ez dut egingo. MUSIKA, GIMNASIA eta ESKULAN--entzat 99 balioa erabiliko dut.

* Zutabe-formatoa: IZENA aldagaian, 25eko luzera. Kateazkoa denez, ez dit hamarrenei buruzko gal-derarik egiten. Data-motakoetan ere ez du egiten; ez luke zentzurik.

JAIOTEGU aldagaia data-motakoa izatean, dd.mm.aa, luzera adierazteko beharrik ez dago. 8 karak-tere dira, 2 egunarentzat, 2 hilarentzat, bi urtearentzat eta tarteko bi puntuak.

SEXUAN 5 zutabe baino gutxiago esaten badizkiot, adibidez 1, balioentzat aski izango da, baina alda-gaiaren izenean S bakarrik ikusiko dut. Gogoan izan pantailan gordetzen dituen zutabe-kopuruariburuz ari dela.

MUSIKA, GIMNASIA eta ESKULAN-en 8ko luzera adieraziko diot, aldagaiaren izena garbi ikusteko.

Aldagaien definizioarekin amaitu dut. Une honetan ondoko orrialdeko pantailaren antzekoa izangodut.

JADA DATUAK IDAZTEN HAS NAITEKE.

Modua zerorrek hauta dezakezu; saltoka joatea ez da ohizkoena. Inork ez dizu galeraziko; gauza arra-roagoak ikusi izan dira, baina hemen bi ohizkoenak azalduko dizkizut.

357SPSSWIN 7.5 bertsioa

Page 370: Estatistika teoria eta praktika SPSSWIN erabiliz

11.2.6. Datuak sartzea

Datuak sartzeko bi modurik ohizkoenak hauek dira: lerroz-lerro eta zutabez-zutabe. Hau da, subjektubaten datu guztiak sar ditzaket lehenik, gero bestearenak... Edo bestela aldagai bati dagozkion datuak sar-tzen ditut lehenik, gero hurrengoarenak... Gure adibidean, lehenik, haur guztien izenak idatziko ditut,gero denen jaiotza-datak, ondoren sexua, eta horrela guztia sartu arte.

Proba egin ezazu eta lehenengoan asmatzen ez baduzu beste modura egiten saia zaitez. Aukeretakobat hau da, eta ez naiz gogoarekin geratuko, zeren datuak lerroka edo zutabeka sartzearen arteko ezber-dintasuna aktibatutako laukiaren datua idatzi ondoren INTRO-ENTER tekla edo tabuladorea sakatzea da.Egin probak.

Azaltzeko modu sofistikatuagoak ere badira. Saguarekin subjektuen zenbakian sakatuz lerroa aktiba-tzen baduzu, lerroa kolorez aldatuko da (azpimarratu egingo da) eta INTRO-ENTER sakatzean zutabebatetik bestera pasatuko da.

Subjektu baten datuak modu jarraian sartzeko lagungarri suertatuko zaizu. Ezer egiten ez baduzuberriz, INTRO-ENTER tekla sakatzean, behealdeko laukia aktibatu ohi da. Hau da, subjektu guztiendatuak aldagai batean sartuko dituzu. Nik egin dudana hori izan da.

Nolanahi ere, beti gogoan izan, IDAZTEN DUZUN DATUA AKTIBATUA DAGOEN GELAXKAN SAR-TUKO DIZULA. Lauki aktibatua azpimarratua azaltzen dena da.

Tekleatzen eta proba egiten has zaitezke.

Ondorengo pantailan, ikus daitekeenez, bost aldagairen datuak sartuak ditut eta seigarrengoarenak(ESKULANenak) sartzen ari naiz.

358

Page 371: Estatistika teoria eta praktika SPSSWIN erabiliz

Pantailara arretaz begiratzen baduzu, JAIOTEGU aldagaiaren zutabean bi data zuriz, baina koma bate-kin azaltzen direla ikusiko duzu; galdutako datuak dira. Ez dut datua sartu, beraz programarentzat haugaldutako balio bat da. 8. kasuko Gimnasiako notan beste datu galdu bat dugu: Illarreta, I.-rena. Hemen,nik galdutako kasuak adierazteko erabili dudan 99 balioarekin azaltzen zait.

ESKULAN aldagaiaren balioetan ere komak azaltzen dira. Oraindik datuak sartu ez ditugun arren,aldagaia definitua dago. Programak ez daki daturik ez dugun edo oraindik idazteko astirik ez dugun izan.Norberak jakingo du zein egoeratan dagoen. Arazorik ez.

Pantailak azaltzen duenez, ESKULAN aldagaiaren 1. laukia dago aktibatua, eta tekleatzen duzun datuahor idatziko dizu.

Gainera, aldagai guztien izenak letra xehez azaltzen zaizkizula konturatuko zinen. SPSSWINek duenlan egiteko modua da hau; letra larrien eta xeheen artean ez duela desberdintzen gogorarazten dizut.

Datuak sartzen segituko dugu, denak amaitu arte.

Amaitu duzu.

Jadanik datu-matrizea eraikia dugu. Ondoren, GRABATU, ARTXIBATU, GORDE..., edo nahi duzunbezala deitu, egin behar dugu. Baina hurrengo batean berekin lan egin nahi baduzu, nire pausoak jarraiitzazu.

Saguaren bidez Archivo-ko botoia aktibatu eta saguaren ezkerreko botoia sakatua duzula, Guardaraukeraraino joan zaitez. Ezkerreko botoia askatu eta pantaila hau lortuko duzu.

359SPSSWIN 7.5 bertsioa

ESKULAN aldagaiaren1. kasua

datu berria idatzikodudan tokia aktibatutako gelaxka

etiketak agertzekoerabiliko dudan ikonoa

DATUGALDUAK

Page 372: Estatistika teoria eta praktika SPSSWIN erabiliz

Nombre de archivo-rentzat gordetako hutsunean, nahi duzun izena idatz dezakezu. Eta GUARDARsakatu. Itxaron une bat eta disko gogorrean grabatuko da.

Fitxategi hau, zuzenean zure disketean gorde nahi baduzu, “Guardar” agindua sakatu aurretik, pan-tailaren goialdean, “Guardar en” hutsuneari dagokion zatian: diskete A: hautatu behar duzu. Hau eginahal izateko, gezia beherantz duen eta aukera-menu bat zabaltzen dizun botoia daukazu.

Izena jartzerakoan, gehienez 8 letra dituen izen bat idaztea komeniko zaizu. Programak, amaierabezala .SAV jarriko dizu. Zuk ez aldatu; arazo gutxiago izango dituzu eta gainera, bost axola!

Eta ADIBIDE hura zela eta, ADIBIDE.SAV deitu diot.

Horrela bada, gaurkoz lana amaitu dugu.

11.3. SPSSWIN 7.5EKO LAGUNTZA-MOTAK

SPSSWINen aukera ezberdinei buruz hitz egiten jarraitu aurretik, paketeak, lan egiterakoan, UNEORO,eskaintzen digun laguntza-mota ezberdinak aurkeztu nahi dizkizut. Hauen artean, bereziki aipagarria etaerabat berria den “AHOLKULARI ESTATISTIKOA” dago.

11.3.1. Laguntza-menua

SPSSWINeko leiho bakoitzak, goi-eskuinaldean galdera-ikur bat dauka eta aktibatuz gero, honen antze-ko menu bat lortuko duzu.

Bertatik, laguntza-menu ezberdinetara iristeko aukeraizango duzu. Era honetakoak dira.

Temas-etik Contenido, Indice, eta Buscar-era joanzaitezke. Hasteko, erakargarriena Aurkibide edo Indiceda, baina interesatzen zaizuna aurkitzen Buscar-eklagunduko dizu. Begira itzazu hauek ondo,... bizitzanzer-nolako laguntzak izan ditzakezun jakitea beti ongidago eta.

360

Page 373: Estatistika teoria eta praktika SPSSWIN erabiliz

Tutorial. SPSSWIN paketearen erabilerari buruzko informazioa eskaintzen dizu; noizean behin begi-radatxo bat bota iezaiozu. Oso interesgarria da. Hemen, zure galderei erantzuten lagunduko dizuten ara-zoen aurkibide bat ere baduzu.

Página principal de SPSS, Interneten SPSS-ko Web orrialdea aipatzen du. Ez dugu honi buruzko aipa-men gehiago egingo. Zuk ikusiko duzu noraino iritsi nahi duzun. Haiek propaganda pixka bat egitekoaprobetxatzen dute. Programazale bat bihurtzen bazara, WEB orrialde honetan entretenitzeko aukeraizango duzu.

Asesor estadístico (Aholkulari estatistikoa). Ez dizkizu zalantza guztiak argituko, baina zenbaitetanoso lagungarri suerta dakizuke. Azalpenekin nahastu baino lehen, galdera-erantzun multzo ezberdineta-tik bidaiatzera gonbidatzen zaitut. Hauen egitura zuhaitza-formakoa izanik, puntu batera eramaten zai-tuzte, bertan paketeak zure erantzunen arabera, zuretzat hautatu duen aukerarekin erantzuten dizularik.Egin itzazu proba ezberdinak. Polita, erabilgarria eta interesgarria da. Nola jokatzen duen? Zuk emanda-ko erantzunez baliatuz eta zure helburuak, datuak eta laginak nolakoak diren aztertu ondoren, komenizaizun analisi estatistikoa zein den erabakitzen du, eta horretarako behar den pantailara eramango zaitu.Begira, begira... OSO ONA DA!

Azkenik, Acerca de SPSS... atalak, erabiltzen ari zaren paketearen bertsioaz eta honen informaziogehiagori buruzko azalpena besterik ez dizu eskaintzen. Ba! Ez zaigu gehiegi interesatzen.

11.3.2. Laguntza elkarrizketa-koadroetan

Elkarrizketa-koadro bateko edozein kontroletan, saguaren ESKUINALDEKO BOTOIA sakatuta, aipatukontrolaren deskribapena egin eta erabiltzeko modua adieraziko dizu.

11.3.3. Beste laguntza bat elkarrizketa-koadroetan

Nahikoa arrunta da zenbait koadrotan, ez guztietan, LAGUNTZA-botoia (AYUDA) topatzea. Aktibatzenbaduzu, koadro horri dagokion laguntzara eramango zaitu zuzenean. Laguntzak, gai horri buruzko infor-mazio orokorra eskaintzeaz gain, gai zehatz horrekin zerikusia duten beste gaien zerrenda bati buruzkoinformazioa eskainiko dizu.

11.3.4. Emaitzak

Emaitzen nabigatzailera bazoaz, eta estatistiko zehatz baten esa-nahia ikusi nahi baduzu, koka zaitez bere gainean. Aktibatuondoren, saguaren eskuineko botoia sakatu, eta hauta ezazu“¿Qué es esto?”. Emaitza interpretatu ahal izateko laguntzaeskainiko dizu. Erabilgarria. Ondorengo leihoan azaltzen dizu-dan kasuan, eragiketa hau maiztasun-taula baten portzentaiekinegin dut, eta ¿Qué es esto? hautatzean, beheko leiho honetanagertzen dena erantzun dit.

KONTUZ!! Ez da erraza ¿Qué es esto? leihoa lortzea. Proba ezazu eta lortuko duzu. Badakizu orde-nadoreekin proba ugari egin beharra dagoela, besteek entseiu eta hutsegite deitzen dutena. Proba... etaproba egiten segi.

361SPSSWIN 7.5 bertsioa

Page 374: Estatistika teoria eta praktika SPSSWIN erabiliz

Hauek dira, funtsean, SPSSWIN 7.5ek laguntza eskaintzeko dituen moduak, nahiz emaitzak lortzekoprozesuan nahiz hauen interpretazio eta analisian. Erabilgarriak suertatuko zaizkizunaren ustetan aur-keztu dizkizut.

Nahi baduzu, SPSSWINen laguntza-testuak inprima ditzakezula adieraztea besterik ez zait geratzen.Horretarako, bloke bat bezala, nahi duzun testua hautatu eta inprimatzeko botoia sakatu behar duzu.Prest. (Inpresora piztu..).

Aurrerantzean, jadanik eraiki dugun datu-fitxategian zer nolako zuzenketak egin ditzakezun ikustenhasiko gara. Datu-edizio bezala ezagutzen diren prozesuak ikusiko ditugu.

11.4. DATUEN EDIZIOA

Geure andereño Elik 3. tokian dagoen ikaslearen jaiotza-data jakin du, eta horrez gain, ikasle bakoitzaikasten ari den musika-tresnaren datua ere sartu nahi du. Lehenengo egunean sartu ez zituen bi neskati-laren datuak ere sartu nahi ditu,... eta atal honetan azalduko ditudan gauza gehiago.

Hori guztia egiteko, datuak gordeak dituen datu-fitxategia irekiz hasi behar du. Gogorarazten dizut,gai honetan sartu (tekleatu) ditugun datuak ADIBIDE.SAV izeneko fitxategian grabatu ditugula.

Beste ezertan hasi baino lehen fitxategi hau berreskuratu egin beharko dugu.

Jar ezazu martxan SPSSWIN programa, eta pantaila nagusira, edo datuen edizio pantailara, heldubezain laster pauso hauek eman itzazu:

ArchivoAbrir...

Eta leiho hau lortuko duzu, bertan ADIBIDE fitxategia hautatu dugularik.

Abrir

Eta pantailan Eliren gelako 16 ikasleen fitxategia izango duzu. Hemen nahi dituzun aldaketak eginditzakezu.

362

Page 375: Estatistika teoria eta praktika SPSSWIN erabiliz

11.4.1. Balio bat aldatu edo ordezkatu

Pausoak hauek dira:

.- Aldatu nahi dudan datuaren laukian kokatuko naiz. Klik egin ezkerreko botoiarekin. Laukia akti-batua geratzen da eta bere balioa laukien editorean ikusten da. Goian.

.- Balio berria idatz ezazu (INTRO).

Kitto!

Adibidea: Andre, E.-ren MUSIKAKO nota aldatu nahi badut, adibidez, 4 bat izan ordez 9 bat zela kon-turatu naizelako, lauki horren gainean kokatuko naiz eta KLIK egingo dut ezkerreko botoiarekin. Pantailahau lortuko dut.

Orain nota berria idatziko dut: 9. Intro.

Prozesu hau bera errepikatuz, datu-fitxategian nahi adina aldaketa egiteko aukera izango duzu.

11.4.2. Aldagai baten definizioa aldatu

Aldagaiaren edozein ezaugarri aldatzeko prozesua berbera da. Izena, aldagai-mota, etiketak, balio gal-duak edo zutabe-formatoa.

Pausoak, berriz, hauek:

Aldagaiaren izenaren gainean kokatu eta ezkerreko botoia bi bider sakatu (Klik bitan egin). Emaitzabera lortuko duzu, aldatu nahi duzun aldagaiaren balioaren gainean kurtsorea kokatuta ere, pantailanagusian honakoa hautatzen baduzu:

DatosDefinir variable...

“Definir variable” leihoa lortu, eta hemen nahi dituzun aldaketak egin ahal izango dituzu. Aceptar.

GIMNASIAko izena MOTRIZI izenagatik aldatzera anima zaitezke. Eta aldagaiaren etiketa bezala:Motrizitatea.

363SPSSWIN 7.5 bertsioa

Page 376: Estatistika teoria eta praktika SPSSWIN erabiliz

Lortu beharko duzun lehenengo pantaila honakoa da:

Aldaketa-prozesua, aurreko atalean azaldu dizudan bezalakoa da.

11.4.3. Kasu bat gehitu

Fitxategiaren amaieran egin nahi baduzu, ez dago hori baino gauza errezagorik. Koka ezazu kurtsoreafitxategiaren amaieran eta idatz itzazu datuak. Besterik ez.

Bi kasuren artean beste bat sartu nahi izan dezakegu (INSERTAR); adibidez, 8. lekuan koka dezakeguikasle berri bat eta bere datuak. Hau da, fitxategian Gereka, M. sartu nahi duzu. Koka ezazu bada kur-tsorea datua sartu nahi duzun lekuan (kasu honetan 8. kasuan) eta eman pauso hauek.

DatosInsertar...

Eta Etxeberria, A. eta Ilarreta, I.-ren artean lerro zuri bat irekiko zaizu. Bertan ikasle berriaren datuaksartu ahal izango dituzu.

11.4.4. Aldagai bat gehitu

Fitxategiaren amaieran aldagai bat gehitu nahi badut, normalki, berau definituz hasi beharko dut.

Azken aldagaiaren atzean jarri nahi baduzu, koka zaitez hutsik dagoen zutabe horretan, eta var baka-rrik agertzen den izenburuan bitan sakatuta aldagaiaren definizio-koadroa agertuko zaizu. Bertan definidezakezu sartu nahi duzun aldagaia. Aldagaia definitu eta gero zutabea prest duzu datuak sartzeko.

Edozer arrazoirengatik, SEXUA eta MUSIKA aldagaien artean aldagai berri bat sartu nahiko bazenu,MUSIKA-ren gainean kokatu (eskuinaldean dagoena delako) eta zoaz honako hauetara:

DatosInsertar variable

Daturik gabeko zutabe bat irekiko dizu honako izenburuarekin: VAR00001. Lauki edota gelaska guz-tietan koma bat agertuko da. Datuak idazten zoazen heinean, komak desagertuz joango dira.

Lehen azaldu dizudan prozesua jarraituz, izena ere alda eta defini dezakezu.

Edozein kasutan, hutsa dagoen zutabe batean datuak sartzen hasten bazara, programak aldagai berribaten datuak sartzen ari zarela ulertuko du. Definitzea besterik ez zaizu faltako.

364

Page 377: Estatistika teoria eta praktika SPSSWIN erabiliz

11.4.5. Datuak ezabatu

Ezabatu nahi duzun kasuaren ezkerraldean agertzen den zenbakian sakatu eta lerro osoa hautatuko da.Ezabatzeko, pauso hauek jarraitu:

EdiciónBorrar

11.4.6. Aldagaiak ezabatu

Sakatu ezazu ezabatu nahi duzun aldagaiaren izen edo izenburuaren gainean eta zutabe osoa hautatukozaizu. Ezabatzeko pauso hauek eman itzazu:

EdiciónBorrar

11.4.7. Azken ekintza desegin

Hanka sartu baduzu, eta nahi ez zenuen zerbait ezabatu baduzu,... (Nori ez zaio gertatu noizbait!), azke-na egindako operazioa desegiteko aukera ematen dizu. Beraz, hanka sartu duzula garaiz ohartzen baza-ra, eman beharreko pausoak hauek dira:

EdiciónDeshacer

Edo berdina dena, ondorengo ikonoan sakatu:

11.4.8. Datu bat bilatu

Imajina ezazu SEXUA aldagaian 3ko balio bat sartu duzula. Ezinezkoa da horrelako daturik izatea.Tekleatzerakoan nahastu egin zara, baina, aldatu ahal izateko aurkitu egin behar duzu. AURKITU NAHIDUZUN ALDAGAIAREN GAINEAN KOKATU ONDOREN, eman beharreko pausoak hauek dira:

EdiciónBuscar...

Eta leiho hau lortuko duzu:

Aurkitu nahi duzun balioa idatzi behar duzu lauki zurian, kasu honetan 3. Eta “buscar hacia adelan-te” edo “buscar hacia atrás” botoian sakatuko duzu. Fitxategiaren hasieran bazaude, logikoki, “haciaadelante”, eta amaieran bazaude, “hacia atrás”.

Programak SEXUA aldagaian 3 idatzi duzun kasuan kokatuko zaitu. Jadanik aldaketa egin dezakezu.

11.4.9. Kasu batera joan

Gerta daiteke 1746. kasuko daturen bat aldatu nahi izatea. Noraezean, topatu ezinik ibili gabe, badu-zu bide azkarrago bat.

365SPSSWIN 7.5 bertsioa

Page 378: Estatistika teoria eta praktika SPSSWIN erabiliz

DatosIr a caso...

Eta leiho hau agertuko zaizu.

Kasuaren zenbakia idatzi: 1746. Aceptar. Eta... konpondunahi duzuna.

11.4.10. Bi artxibo elkartu. Kasu edota aldagai gehiago

Artxibo ezberdinak elkartzeko garaian ere SPSSWINek eskaintzen dituen aukerak oso handiak dira.

Atal honetan, aukera hauen berri ematen lagunduko didaten bi adibide sinple aurkeztea da nire hel-burua.

Arestian, konplikatzeak ez duela pena merezi adierazi dizut. Kasu honetan bada, gomendio honekgarrantzi berezia hartzen du. Aldagai berak, baina subjektu ezberdinak dituzten bi fitxategi elkartu nahiizan ditzaket...

11.4.10.1. Kasu gehiago 2. fitxategi bat egin

Aldagai eta kasu gehiago sartzeko modua ikusi dugu.

Pentsa ezazu alboko ikasgelan, Viki andereñoak lan egiten duela eta, VIKI.SAV izeneko bere datu--fitxategia sortu duela. Hasierako gure fitxategiaren aldagai berberak ditu, ADIBIDE.SAV, baina bere gela-ko ikasleen datuekin.

VIKI-k bere datuak DISKETE BATEAN ekartzen ditu. Datu hauekin modu taldekatuan lan egin ahalizateko, fitxategi biak batean elkartu nahi ditut. VIKI.SAV fitxategia ADIBIDE fitxategiaren azken zatiare-kin elkartuko dut. Prozesu honi FITXATEGIAK BAT EGITEA deritzo.

Horretarako, ADIBIDE.SAV fitxategia ireki behar duzu eta fitxategia pantailan duzula honakoa egin:

DatosFundir archivos

Añadir casos...

Eta ondorengo leiho hau lortuko duzu, bertan A disketean aurkitzen den VIKI.SAV fitxategia gehitunahi dudala adierazi diot. Horretarako, goialdean honakoa hautatu behar izan dut: Disco de 3 1/2 (A:).Behin hor egonik, fitxategiaren izena...

366

Page 379: Estatistika teoria eta praktika SPSSWIN erabiliz

Eta beste leiho hau lortuko duzu.

Aceptar

Emaitza pantailan izango duzu: fitxategi berri bat, non 16 + 14 ikasleren datuak elkartu ditudan. Ikusdezakezunez, oraindik ez du izenbururik; fitxategi berria GORDETZERA zoazenean emango diozulakoandago.

11.4.10.2. Aldagai gehiago. 2 fitxategi bat egin

Oraingoan gai hau dugu eskuartean: Elik bere fitxategian 6 aldagairen datuak barneratu ditu eta bestebatean, beste lau aldagairenak. Bi fitxategietako subjektuak berberak dira.

Ondorengo egoera oso tipikoa da. Ikertzaile batek tratamendu zehatz bat ezarri baino lehenago sub-jektu batzuen datuak neurtu ditu, eta tratamendu ostean datu gehiago neurtu dizkie pertsona edo ele-mentu berberei. Laburtuz, subjektu berberak, ordena berberean fitxategi bitan aldagai diferenteak dituz-te.

367SPSSWIN 7.5 bertsioa

Page 380: Estatistika teoria eta praktika SPSSWIN erabiliz

Arazorik ez izateko, bi fitxategietan izen bereko aldagaiak ez edukitzea gomendatzen dizut. Bikoiz-tutakoren bat balego, bi fitxategietako batetik kentzea edo bestela, egokiena, batean izena aldatzea da.

Gu egoera honetan gaude; 16 subjektu eta aldagai batzuk fitxategi batean, eta 16 subjektuen bestealdagaiak bigarrengoan. Bietako informazioa batu egin nahi dugu.

Ordenadorean ADIBIDE.SAV fitxategia daukat, eta diskete batean, aurrekoari batu nahi diogun ADI-BIDE2.SAV fitxategia ekartzen didate.

ADIBIDE.SAV fitxategia ireki ondoren, pauso hauek eman behar dira:

DatosFundir Archivos...

Añadir variables...

Leiho hau lortuko dugu:

A disketean dagoen ADIBIDE2.SAV fitxategiaren aldagaiak gehitzeko eskatzen diodala ikus daiteke.Abrir.

Beste pantaila hau lortuko dut.

368

Page 381: Estatistika teoria eta praktika SPSSWIN erabiliz

Bertan Nuevo archivo de datos de trabajo-n aldagaien zerrenda agertzen zait. ADIBIDE.SAV fitxate-giko IZENA, JAIOTEGU, SEXUA, MUSIKA, GIMNASIA eta ESKULAN, eta ADIBIDE2.SAV fitxategiko MAI-LASOZ, MATEMATI, NATURZIE.

Ez dugu gehiago nahastuko. Aceptar.

Eta elkartze-prozesua burutu da. Pantaila aurrean, fitxategi BERRI BAT duzu, aurreko subjektu berbe-rekin, baina bi fitxategietako aldagaien datuekin. IZENBURURIK GABE agertzen da. Gordetzeko garaiannahi duzun izenburua eman diezaiokezu.

Hauek adibide bi izan dira, fitxategiak elkartzearen adibide ohizkoenak. Lehen esan bezala, alorhonetan ere SPSSWINek eskaintzen dizkigun aukerak oso zabalak dira. Horietako bat aurkeztea besterikez da izan nire helburua.

11.5. DATUEN ERALDAKETAK

11.5.1. Aldagai berrien sorrera eta kalkulua

Demagun eskola-errendimenduko nota bezala, nire fitxategiko hiru puntuazioen batezbestekoa interesa-tzen zaidala: GIMNASIA, MUSIKA eta ESKULAN. Edo zutabe zehatz batzuetan agertzen diren kantitate-ak batu nahi ditudala, edo azpimarratu, edo zatitu...

Honen antzeko egoerak sarritan topatzen ditugu, eta erraz askatuko ditugu pauso hauek emanaz, betibezala, datu-fitxategia ireki ondoren:

TransformarCalcular...

Eta pantaila hau lortuko dut:

Bertan, ezker-goialdean, Variable de destino-n, ERRENDI idatzi dugu, aldagai berriaren izena, alegia.Eta eskuinaldean berriz, aldagai berri hau lortzeko egin nahi dudan kalkulua: hiru aldagaiak batu eta zati3 egin.

Parentesiek eta eragiketek ohizko arau matematikoak jarraitzen dituzte.

Aldagaiak idatzi beharrik ez dut. Ezkerreko leihoan azpimarratuko ditut eta gezia duen botoia saka-tuz, tokiz aldatuko zaizkit. Ezabatzeko, ohizko teklak erabili beharko dituzu.

369SPSSWIN 7.5 bertsioa

Page 382: Estatistika teoria eta praktika SPSSWIN erabiliz

Parentesiak, zifrak eta gainerantzeko sinboloak, beti bezala, zuzenean teklea ditzakezu edo pantailanagertzen zaizun kalkulagailu txikia aprobetxa dezakezu.

Aldagai berriarentzat, kasu honetan ERRENDI, interesgarria suerta dakizuke etiketak gehitzea... edomota definitzea. Hau guztia, aldagai berriaren azpian aurkitzen den, Tipo eta etiqueta errotulua duenbotoia sakatuz egin dezakezu. Aceptar.

Eta programak aldagai hau gehituko du jadanik fitxategian daudenetara.

11.5.2. Aldagaia kalkulatu: Baldin… (Si los casos...)

Hau, sarritan oso erabilgarria suertatzen den bigarren aukera bat da.

Demagun mutilek gimnasiako puntuaziorik ez dutela. Zergatik? Bada, bestela adibidea ez zaitelakoateratzen...

ERRENDI aldagaia modu honetan eraiki nahi dut:

Neskentzat (SEXUA = 1) hiru noten batezbestekoa.Mutilentzat (SEXUA = 2) MUSIKA eta ESKULANeko batezbestekoa.

Ikus dezagun aldagai hau nola sortzen dugun, kalkulu hauek SPSSWINekin eginaz.

Behin fitxategia ireki eta gero:

TransformarCalcular...

Eta leihoko SI... botoia sakatuko dut. Eta hau lortuko dut:

“Incluir si el caso satisface la condición” botoia aktibatu dut.

Eta behealdean SEXUA = 1 idatzi dut.

Hau egitean, ondoren egitera noan eraldaketa, baldintza hori betetzen bada bakarrik burutu behardela jakinarazten ari naiz. Neskentzat, alegia.

Zein da eraldaketa hori? Continuar sakatu, eta aurreko kasuaren antzeko pantaila bat agertuko zait,bertan, burutu beharreko kalkulua definituko dudalarik.

370

Page 383: Estatistika teoria eta praktika SPSSWIN erabiliz

Ohar zaitez behealdean, SI... botoiaren alboan, SEXUA = 1 agertzen dela.

Goiko leihoan adierazi diodan kalkulua, baldintza hau betetzen den kasuetan bakarrik dela baliozkoaohartarazten dit. Aceptar.

Une honetan ERRENDI aldagaia sortu du baina neskentzat bakarrik, mutilentzat ez baitut definitu.Ohar zaitez datu-fitxategian, SEXUA = 2 den kasu guztietan, sortu berria duen ERRENDIren zutabeberrian, komatxo bat jartzen duela.

Kasu horietan zer egin behar duen orain esango diogu. MUSIKA eta ESKULANeko batezbestekoa kal-kulatu behar du. Horretarako pausoak hauek dira.

Prozesu osoa errepikatzeari ekingo diot:

TransformarCalcular...

Eta leihoko Si... botoia sakatu eta hau lortuko duzu.

“Incluir si el caso satisface la condición” botoia aktibatu dut.

Eta behealdean SEXUA = 2 idatzi dut. Continuar.

371SPSSWIN 7.5 bertsioa

Page 384: Estatistika teoria eta praktika SPSSWIN erabiliz

Aldagaiaren kalkuluaren leihoa azaltzen da orain, bertan eraldaketa berriaren deskribapena burutzendudalarik. Horrela:

Aceptar.

Eta DAGOEN ALDAGAIA ALDATU NAHI AL DEN galdetzen du. SI erantzuten diot. Eta automatikokialdagai berria sortuko du.

ESKULAN aldagaiaren eskuinaldean emaitza bezala, ERRENDI aldagaia sortu du. Aldagaiaren zenbaitbalio behealdeko pantailan aurkezten ditu. Froga dezakezu SEXUA = 1 balioa, hiru puntuazioen batez-bestekoa dela, eta aldiz, SEXUA = 2, MUSIKA eta ESKULAN-ena bakarrik.

372

Page 385: Estatistika teoria eta praktika SPSSWIN erabiliz

11.5.3. Balioen berkodetzea. RECODE.

MUSIKA-ko notak 0tik 10erako eskalan ditugu. Aldiz, ondorengo analisi baterako, subjektuak bi taldetanbanatzea interesatzen da: gainditu dutenak (5 edo puntu gehiago) eta gainditu ez dutenak (4 edo puntugutxiago). Eraldatze hau ALDAGAI BATEN BERKODETZEA izenarekin ezagutzen da.

Mota honetako eraldaketei buruz hitz egiteko bi puntuazio-motak edukitzea interesatzen ote den edoez gogoan izan beharko da.

Zenbaitetan, jatorrizko notaz ahaz daiteke, besteetan, puntuazio ezberdinen batezbestekoa kalkulatunahi bada, adibidez, biak mantendu beharko dira: jatorrizkoa eta berkodetua.

Hau (jatorrizkoa gordetzearena edo ez gordetzearena) hasieratik oso garbi eduki behar da, hartu beha-rreko lehen erabakia dela ikusiko baitugu. Zalantzan bazaude nik hartuko dut erabakia: BIAK MANTEN-DU.

Jatorrizkoa mantendu nahi bada, ALDAGAI DESBERDINETAN BERKODETZEA hautatuko da eta gordenahi ez bada, ALDAGAI BEREAN BERKODETZEA. Esandakoa, zalantzaren aurrean, Recodificar en dis-tintas variables, izan da hautatu dena.

Gogoan izan hau izango dela aldagai numerikoak, aldagai koalitatibo edo kategorikoetan bihurtzekonormalki erabiliko den prozedura.

Ikus dezagun, MUSIKAko notak bi kategoritan (gainditua eta ez gainditua) eraldatzeko prozesua zeinden.

TransformarRecodificar

En distintas variables...

Eta pantaila hau lortzen da:

Bertan berkodetu beharreko aldagaia MUSIKA dela eta ondoriozko aldagaia MUSIKABI dela adierazida. Aldatzeko tekla sakatzen den unean, erdialdeko leihoko zeinua desagertu eta MUSIKABI azalduko da.

Valores antiguos, y nuevos... botoia sakatu eta beste leiho hau azalduko da, bertan eraldaketa defini-tuko delarik.

373SPSSWIN 7.5 bertsioa

Page 386: Estatistika teoria eta praktika SPSSWIN erabiliz

Azter dezagun aurreko pantaila. Hiru zati ditu. Ezkerraldean, Valor antiguo-ren izenpean, berkodetu-ko diren balioak zeintzuk diren adieraziko da. Gauzak errazteko asmoz, aukera ezberdinak eskaintzenditu. Nik kasu honetan (botoia puntu batekin markatua dagoela ikus ezazu) “Del menor hasta 4” dioenahautatu dut. Beste aukerak azter ditzakezu. Eskuinaldean, goian, Valor nuevo-n, berria adierazten diot;gure kasuan 1. Añadir sakatu orduko, eskuinaldeko leihoan azalduko da, behealdean, programak eralda-keta ulertu duen moduan. Behealdeko pantailan ikus dezakezu.

Ingelesez idatzi du, programak itzultzen duen hizkuntza hori baita, baina guri ez digu trabarik egiten;sintaxia landu nahiko bagenu beste gauza bat litzateke, baina ez da hori gure kasua ez eta liburuaren hel-burua ere.

Imajinazio pixka baten laguntzaz, ordenadoreak gure eraldaketa ongi ulertu duela “ikus” dezakezu.Edo fida zaitezke...

Behealdeko pantailan ere, 5eko puntuazio batetik handienera balio berria 2 bat dela esango diogu.Añadir.

Continuar. Eta berkodetzea hasi dugun leihora itzultzen da. Aceptar.

Eta MUSIKABI aldagai berria sortu digu, bertan 1 balio bakarra azaltzen da, suspentso bakar bat. Frogaezazu.

Jarraian, interesatuz gero, etiketak gehi daitezke, bai aldagaiaren izenari, bai honen balio ezberdineiere.

374

Page 387: Estatistika teoria eta praktika SPSSWIN erabiliz

11.6. KASUEN AUKERAKETA

Hurrengo analisia neskekin bakarrik, edo Musika aldagaian 9 puntu lortu dituztenekin edo otsailean jaio-takoekin, edo... Xekin, egin nahi dut.

Hau KASUEN AUKERAKETAREKIN konponduko dut.

Kasuen aukeraketa-prozesuen bitartez, laginaren azpitalde batekin lan egiten uzten diguten metodobatzuk dauzkagu.

Landu nahi dudan fitxategian, ADIBIDE.SAV ireki ondoren, kasuen aukeraketa egiteko modua hau da:

DatosSeleccionar casos...

Eta ondorengo pantaila lortzen da.

Pantaila honetan, ezkerraldean aldagai-zerrenda bat dago eta eskuinaldean, hautaketa ezberdinakaukera daitezke. Lehenengoa, goian (Todos los casos); honek ez du ezer aukeratzen. Hala ere garrantzi-tsua izango da, uneren batean, hortik aurrera kasu guztiekin lan egin behar dela adierazteko zeren etakasuen aukeraketa desaktibatzen ez den bitartean, hautatu direnekin bakarrik lan egingo baitu.

Beste aukerekin, baldintza zehatz bat betetzen dutenak hauta daitezke, edo datuen zorizko lagin bat(hauen % bat), edo iragazki bezala erabil daiteke aldagai bat, hau da, 0 balioaren ezberdina den edozeinbaliorekin edo hautatutako iragazkiaren aldagaian galdutako balioarekin hautatzen dira kasuak.

Adibide bezala, NESKAK izatea baldintza betetzen duten subjektuak hautatu nahi nituzke, hau daSEXUA aldagaian 1 balioa hartzen dutenak.

Aurrera egin aurretik, pantailaren behealdean, hautatuak izan ez diren kasuei buruz ari den zerrendabat azaltzen dela adierazi nahi nuke. IRAGAZI edo EZABA daitezke. Ezabatzeak laneko datu-fitxategitikborratzen direla esan nahi du. Erabaki larria da hau. Iragazteak berriz, “oraingoz” analisian sartzen ezbada ere, laneko fitxategian jarraitzen duela esan nahi du. Zalantzan egonez gero, FILTRADOS (IRAGA-ZI) aukera har daiteke, noski.

375SPSSWIN 7.5 bertsioa

Page 388: Estatistika teoria eta praktika SPSSWIN erabiliz

Ikus dezagun nola burutzen den KASUEN AUKERAKETA: Si satisface la condición...

Aurreko leihoak adierazten duen egoeran, hau da Si satisface la condición-en, botoia aktibatu ondo-ren (erdian puntu bat agertzen da), SI... botoian sakatzen da eta beste pantaila hau agertuko da:

Hemen, hautatu diren subjektuek bete behar duten baldintza idatzi da. Continuar.

Eta aurreko leihora bueltatzen da, bertan SI... botoiaren alboan hautaketaren espresio logikoa azaldu-ko delarik: sexua = 1.

Aceptar.

Aukeraketa egina dago. Datu-fitxategia horrela geratzen da.

5. eta 6. kasuak, Sexua = 2ri dagozkionak, zenbakiaren laukia gurutzatzen duen diagonal batekin azal-tzen direla ikus daiteke. Ez daude hautatuak. Hurrengo analisian subjektu hauek ez dute parte hartzerikizango. Horixe nahi zen.

KONTUZ! Lehen aipatu da, baina bat baino gehiago oraindik kasuak bilatzen ari da... Prozesu osoaerrepikatzen ez den bitartean eta beste analisi baterako subjektu guztiak hautatzen ez diren bitartean, eginden hautaketak baliagarria izaten jarraitzen du. Hau da, hautaketa hori baliogabetzeko, kasuen hautaketa-

376

Page 389: Estatistika teoria eta praktika SPSSWIN erabiliz

-gunera itzuli behar da, eta Todos los casos botoia aktibatu. Eta dagoen-dagoenean fitxategia gordetzenbada, aukeratu gabeko datuak galdu egingo dira. KONTUZ! Artxibatu baino lehen egin den aukeraketa desaktibatu.

11.6.1. Kasuen zorizko lagin baten aukeraketa

Aukera honek, zoriz hautatutako datu-portzentaia batekin lan egiten uzten du. Oso interesgarria suertadaiteke, datu-fitxategi handiekin lan egiteko, batez ere. Ikus dezagun aukeraketa egiteko modua zein den:

Kasuen Aukeraketaren hasierako leihoan: Muestra aleatoria de casos botoia eragiten bada, etaMuestra-n sakatzen bada, leiho hau lortuko da.

Bi aukera eskaintzen ditu.

Laginaren gutxi gorabeherako portzentaia bat hautatzea eska daiteke, goialdeko ilararen hutsuneanadieraziz: adibidez, % 25.

Edo norberak adierazi behar dituen datu-kopuru zehatzen artetik, zehazten duen beste kasu-kopuruzehatz bat hauta dezan eska daiteke. Adibidez, lehenengo 1.200 kasuetatik 135 hautatzeko esan daiteke.

Continuar.

Aceptar.

Hurrengo analisia hautatutako laginarekin bakarrik burutuko da.

OHARRA: egin den aukeraketa ezabatzeaz gogoratu, bestela, hautatutako elementuekin bakarrik lanegiten jarraituko du.

11.6.2. Artxiboa segmentatu edo banatu

Aurreko helburuaren osagarri bezala analisi zehatz bat egiten da, baina datuak banatu diren talde ezber-din bakoitzari analisi bana eginaz.

Adibidez, mutilen analisi bat egin eta gero hori bera neskentzat errepikatu nahi izatea; edo lau aldizerrepikatu nahi da, gipuzkoar, arabar, bizkaitar eta nafarrentzat... Eragiketa hau egiteko ARTXIBOA SEG-MENTATU egin beharko da.

Prozesua hau da:

DatosSegmentar archivo...

377SPSSWIN 7.5 bertsioa

Page 390: Estatistika teoria eta praktika SPSSWIN erabiliz

Eta pantaila hau lortzen da:

Bertan, aldagaien zerrenda ezkerraldean ikusten da eta erdialdean, berriz, aukera ezberdinak.Lehenengoak aurresegmentazio bat desegiteko balio du. Bigarrengoa eta hirugarrengoa gehien erabilikodirenak izango dira.

Zenbaitetan, gero analisiaren prozeduran beharko diren (leihoko 2. aukera) aldagai zehatz batean, tal-deak konparatzea interesatuko da, eta besteetan emaitzak taldetan banatu eta zatitu nahiko da (3. auke-ra).

Goiko leihoan aurkezten den kasuan, 3. aukera adierazi da. Fitxategia SEXUA aldagaiaren arabera seg-mentatu nahi dela ere adierazi da. Aceptar.

Orain, adibidez, MUSIKA aldagaiaren maiztasunak kalkulatzeko eskatzen bada, eman beharreko pau-soak hauek dira:

EstadísticosResumir

Frecuencias...

Leiho hau lortuko da:

378

Page 391: Estatistika teoria eta praktika SPSSWIN erabiliz

Aceptar.

Emaitzak hauek dira:

MUSIKA

MUSIKA aldagaiaren emaitzak bi atal ezberdinetan nola bana daitezkeen ikusten da; hau da FITXA-TEGIA SEGMENTATZEAREN helburua.

OHARRA: kasuen hautaketaren egoeran bezala, amaieran, burututako segmentazioa ezabatzeazgogoratu. Bestela, emaitzak fitxategi segmentatuarekin lortzen segiko du.

Aurreko emaitzen pantailak, gai honen azken atalean sartzeko aukera ematen du, emaitzen fitxate-giaren erabilpenari dagokiona.

11.7. EMAITZEN FITXATEGIAK

Irudiaren munduan bizi garela esatea ukaezina da, gauzak modu erakargarriagoan aurkezten saiatzengarela aitortzea beharrezkoa den bezala.

SPSSWIN 7.5ek, zenbait analisi estatistiko burutzen dituenean, emaitzen fitxategian gordetzen ditu etaerakargarria iruditzen den formatoa emateko aukera eskaintzen du. Are gehiago, beraien artean mugitze-ko, ikusteko, editatzeko, aldatzeko, beraiekin lan egiteko... aukera ematen du. Prozesu hauek guztiakerrazteko, bertsio honek EMAITZEN NABIGATZAILEA ere badu.

379SPSSWIN 7.5 bertsioa

Tabla de frecuencia

Válidos

Total

Válidos

Total

SEXUA

NESKA

MUTILA

Frecuencia Porcentaje

4

6

7

8

9

Total

4

6

7

8

9

Total

Porcentajeválido

Porcentajeacumulado

1

1

3

3

1

9

9

11,1

11,1

33,3

33,3

11,1

100,0

100,0

11,1

11,1

33,3

33,3

11,1

100,0

11,1

22,2

55,6

88,9

100,0

14,3

42,9

57,1

85,7

100,0

14,3

28,6

14,3

28,6

14,3

100,0

14,3

28,6

14,3

28,6

14,3

100,0

100,0

1

2

1

2

1

7

7

Page 392: Estatistika teoria eta praktika SPSSWIN erabiliz

Ikus dezagun adibide bat:

Pantaila erditik ebakia dagoela ikus dezakezu (hauetako bakoitzaren zabalera alda dezakezu).

Ezkerrean emaitzen aurkibidea dago. Saguarekin kokatu eta ezkerraldeko botoia sakatzen den heine-an (KLIK), eskuinaldeko emaitzen fitxategia, automatikoki, markatu den emaitzen aldean kokatzen da.

Eskuinaldean emaitzak daude; edita daitezke. Hau da, norberak nahi bezala alda daitezke.Horretarako, aldatu nahi den taula, izenburu edo grafikoan kokatu eta KLIK BITAN egin. Hautatutakoobjektua azpimarraturik markoan agertuko da. Orain, interesatzen den lekuan sagua sakatzen den heine-an, hau editatua agertuko da. Forma alda daiteke, kolorea... baita balioa ere. Dena, edozein editatzailezariko bagina bezalaxe.

Prozesu hauetan laguntza izan dezazun, goiko aldean menu ezberdinak daude eta baita eragiketa des-berdinak egiten lagunduko duten ikonoak ere.

Taulekin nahiz grafikoekin aukerak izugarriak dira, baina ez dut jarraituko, emaitzen nabigatzaileakeskaintzen dituen aukera guztiak hemen jorratzea ezinezkoa baita.

Datu-fitxategiarekin egin ohi diren hiru eragiketa arruntenetara mugatuko naiz: Inprimatu, artxibobatean kopiatu (diskete nahiz disko gogorrean) eta testu-prozesatzaile batean sartu.

Eragiketa hauek guztiak, emaitza guztiekin, edo aurrez hautatutako batzuekin egin daitezke.

Emaitza bakar batzuk hautatzeko, ezkerreko emaitzen aurkibidean, nahi den zatiari dagokion botoian(ikonoan) sakatuko da. Gogoratu zuhaitza antzeko egitura duela eta adar lodi batean sakatuz gero, ber-tatik sortzen diren adartxoak ere hautatuak geratzen direla. Beste gauza bat..., interesatzen ez den zerbaitbaldin badago, aurrez ezabatu daiteke. Nola? Hautatu eta Edición, Cortar-era joan.

380

Page 393: Estatistika teoria eta praktika SPSSWIN erabiliz

11.7.1. Imprimir

Erraza, Inprimatu nahi dena hautatu eta gero, inpresorako ikonoan sakatu:

Edo pauso hauek eman daitezke:

ArchivoImprimir..

Eta pantaila hau lortuko da:

Aceptar botoia sakatu aurretik, ezkerreko behealdean fijatu behar da, inprimatzeko zatian, Emaitzaguztiak ikusiz edo Selekzioarekin egin nahi den, alegia. Eskuinaldean kopia-kopurua zehaz daiteke. Etaorain bai... Aceptar.

11.7.2. Fitxategi batean kopiatu. GUARDAR COMO...

Emaitzak diskete batean gorde, eta beste leku batera eraman daitezke. Demagun, darabilgun ordenado-reak ez duela inpresorarik edo okupatua duela. Emaitzak fitxategi batean, zure disketean gordetzea inte-resa liteke. Emaitzei EMAITZAK (8 letra) izena eman dakieke. Eman behar diren pausoak hauek dira:

ArchivoGuardar como...

Eta leiho hau lortuko da.

381SPSSWIN 7.5 bertsioa

Page 394: Estatistika teoria eta praktika SPSSWIN erabiliz

Goialdeko zerrendan, Guardar en: Disco de 3 1/2 (A:) hautatu dela ikusten da. Prozesua Windows95ekoaren ohizkoa da. Eta Nombre de archivo-n: EMAITZA idatziko da.

Sartu ezazu disketea.

Guardar.

11.7.3. SPSSWINeko emaitzak testu-prozesatzaile batean (WORD) nola sartu

Zenbaitetan, jadanik SPSSWINek hain dotore eraiki dituen taulak berriro eraiki behar izatea, nahikoa lanastuna izan ohi da. Nik, modu errazean, adibidez WORD-era pasatzeko, nola egin daitekeen adierazikodut. Windowsen funtzionatzen duten gainerantzeko testu-prozesatzaileekin, prozesua oso antzekoa da.

Zure egoera hau da: zure ikasleen MUSIKAKO notei buruzko txosten bat idazten ari zara. Idazten arizara eta jadanik, WORDeko testuaren fitxategi bat irekia duzu. SPSSWIN 7.5en analisi bat burutu berriaduzu eta emaitzen nabigatzailean zaude. SPSSWINekin lortu berria duzun MUSIKAKO Histograma zora-garria, WORD-era pasa nahi duzu. Hauek dira horretarako pausoak.

Honen antzeko SPSSWINeko emaitzen pantaila batean zaude.

Ezkerraldeko Gráfico errotuluaren gainean sakatu eta zuhaitz osoa azpimarratu da: Gráfico, Título,Notas eta Histograma. Era berean, eskuinaldean izenburua eta histograma markoan azaltzen dira.LANDU NAHI DEN ZATIA ZEIN DEN HAUTATU DA JADANIK.

Orain kopiatu egin nahi dela adieraziko da, modu honetan.

EdiciónCopiar objetos...

382

Page 395: Estatistika teoria eta praktika SPSSWIN erabiliz

Memorian gorde du jadanik.

Une honetan WORD-era pasa beharko da. Ataza-barran minimizatua baldin badago, berriro aktiba-tzeko unea da.

Word-en Pantailan zaude, jadanik

Orain, WORD-en, kurtsorea histograma kokatu nahi den testuaren gunean dela, pauso hauek eman behardira:

EdiciónPegar

Eta Histograma kurtsorea kokatua zegoen lekuan sartuko da.

Oro har, estatistikaren eta emaitza estatistikoen azken helburua eta amaiera hau da: ikerketa txostenbatean edo beste edozein dokumentutan sartzea, alegia.

Liburu hau ere hemen amaitzen da. Baina amaitu aurretik, estatistika ez dela ikerketaren azken hel-burua esan nahi nizuke, gure datuetan gordetzen den errealitatea “ikusten” laguntzen digun baliabide batbaizik. Horretarako, ezinbestean, gure ikerketa garatzen den ingurune teorikoaz osatu beharko dugu, etaemaitzak teoriaren argitan eta itzaletan aztertu, ikasi eta integratu beharko ditugu.

Liburu honek prozesu honetan guztian laguntzea eta, era berean, hau guztia erraztea espero dut.

383SPSSWIN 7.5 bertsioa

Page 396: Estatistika teoria eta praktika SPSSWIN erabiliz