Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la...

43
à Anàlisi de dades amb St ti ti l P d t d S i S l ti Statistical Product and Service Solutions Pedro López Roldán Departament de Sociologia ó Departament de Sociologia T ransformació de les dades…

Transcript of Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la...

Page 1: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

àAnàlisi de dades ambSt ti ti l P d t d S i S l tiStatistical Product and Service Solutions

Pedro López RoldánDepartament de Sociologia

ó

Departament de Sociologia

Transformació de les dades…

Page 2: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformació de les dades La transformació de les dades implica operar

amb les variables inicials del fitxer de dadesamb les variables inicials del fitxer de dades per tal de:

Modificar les (correccions i canvis) Modificar-les (correccions i canvis). Generar de noves (agrupacions, índexs, tipologies)

La transformació obeeix a la necessitat de La transformació obeeix a la necessitat de preparar les dades per a la seva anàlisi.

I en particular també a la tasca la verificació I en particular també a la tasca la verificació de les dades disponibles.

Menú Transformar Menú Transformar

Page 3: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformació de les dades

Menú “Transformar”

Page 4: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades1. Tipus de transformacions

Tipus de comandaments: Recodificació de variables: RECODE AUTORECODE Càlcul de variables: COMPUTE Recompte de casos: COUNT Transformacions condicionals:

IF DO IF ... ELSE IF ... ELSE ... END IF LOOP IF ... END LOOP IF

Selecció de casos: SELECT IF, FILTER

Page 5: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades2. Expressions

Les expressions de transformació Les expressions de transformacióespecifiquen la sintaxi de les instruccions delscomandaments de transformació mitjançantcomandaments de transformació, mitjançantl’ús d’operadors i funcions.Hi h t ti d’ i Hi ha tres tipus d’expressions: Numèriques

è Alfanumèriques Lògiques.

Page 6: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades3. Expressions numèriques

Transformacions de variables i valorsnumèrics.

Operadors aritmètics: + – * / **p A les expressions s’utilitzen conjuntament amb els

noms de les variables, les constants i les funcions.d èi d i No poden aparèixer dos seguits.

No poden introduir-se abans o després d’unoperador lògic o relacionaloperador lògic o relacional.

S’executen després de les funcions. Al mateix nivell s’executen d’esquerra a dreta Al mateix nivell s executen d esquerra a dreta.

Page 7: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades3. Expressions numèriques

Funcions numèriques: Són operadors a través d’una funció de

transformació de valors numèrics que retornaúnúmeros (o valors perduts del sistema).

La funció s’aplica a un (o més) argument(s), unaió bj t d l t f ió ’i lexpressió objecte de la transformació que s’inclou

sempre entre parèntesis.p ex : MEAN (V1 V2 V3)p. ex.: MEAN (V1,V2,V3)

Poden incloure operadors aritmètics, constants ivariablesvariables.

Page 8: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades3. Expressions numèriques

Tipus de funcions numèriques: Funcions aritmètiques: ABS(arg), RND(arg),

TRUNC(arg), SQRT(arg), EXP(arg), LG10(arg),LN(a g)LN(arg),...

Funcions estadístiques: MEAN(arg list), SD(arg list) MIN(arg list) MAX(arg list)list), MIN(arg list), MAX(arg list),...

Funcions de variable aleatòria i funcions de distribució: CDF d spec(q a )distribució: CDF.d_spec(q,a,...), PDF.d_spec(q,a,...), RV.d_spec(a,...), SIG.d_spec(q,a,...),...

Page 9: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades4. Expressions alfanumèriques

Expressions en què s’impliquen variableslf è i ( d )alfanumèriques (cadena).

L’avaluació de l’expressió retorna valorslf è ialfanumèrics.

Poden incloure constants (valors cadenat è t i ) i bl f ióentre parèntesis), una variable o una funció.

Funcions: Alfanumèriques o cadena De cerca

D ió De conversió

Page 10: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades5. Expressions lògiques

Una expressió lògica és aquella que s’avalua comcerta (1) falsa (0) o valor perdut (system missing)certa (1), falsa (0) o valor perdut (system missing),basada en condicions establertes sobre les dades apartir de variables, constants, funcions, operadors

l i l i d lò irelacionals i operadors lògics. Les expressions s’ha d’incloure entre parèntesis.

Operadores relacionals: Operadores relacionals:

Operadores lògics:EQ LT GT NE LE GE

o bé = < > <> <= >=p g

Exemple:

AND OR NOTo bé & | ~

IF (V1=1 AND V2 GE 5) V3=1.

Page 11: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades6. Altres funcions

F i d l d t VALUE( ) Funcions de valors perduts: VALUE(arg),MISSING(arg), SYSMIS(arg), NMISS.F ió d t i LAG( ) Funció de n casos anteriors: LAG(arg,n)

Funcions lògiques: RANGE, ANY Funcions de data i hora:

Funcions d’agregació Funcions de conversió Funcions d’extracció

Page 12: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades7. Recodificació

Comandaments RECODE AUTORECODE La recodificació de variables permet canviar els seus La recodificació de variables permet canviar els seus

valors actuals per altres de nous a partir dels criteris que s’especifiquin.

Sobre la mateixa variable

La recodificació es pot fer:

L difi ió l’ ió d l

Creant una nova variable Generant-la automàticament

La recodificació permet l’agrupació de valors: Criteri substantiu Criteri empíricp

Es poden recodificar variables amb format numèric o cadena.Cal després etiquetar els valors i completar la definició Cal després etiquetar els valors i completar la definició

Page 13: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades7. Recodificació

Esquema de sintaxi RECODE

For numeric variables:RECODE varlist (value list=value)...(value list=value) [INTO varlist]

[/ li ][/varlist...] Input keywords:LO, LOWEST, HI, HIGHEST, THRU, MISSING, SYSMIS, ELSE Output keywords:Output keywords:COPY, SYSMIS

For string variables:RECODE varlist [('string',['string'...]='string')][INTO varlist]

[/varlist...] Input keywords: CONVERT, ELSE O t t k dOutput keyword:COPY

Page 14: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades7. Recodificació

Exemple 1: variable numèrica. Sintaxi

FRE SALARIO.RECODE SALARIO (LO THRU 24999=1) (25001 THRU 34999=2)

(35000 THRU HI=3) INTO SALARIO2.VAR LAB SALARIO2 "Nivel de salario".VAL LAB SALARIO2 1 '15750-24999' 2 '25000-34999'

3 '35000-135000'.FORMATS SALARIO2(F1 0)FORMATS SALARIO2(F1.0).FRE SALARIO2.

Page 15: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades7. Recodificació

Exemple 1: variable numèrica. Menú

Page 16: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades7. Recodificació

Exemple 1: variable numèrica. Menú

Page 17: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades7. Recodificació

Exemple 2: variable cadenaRECODE SEXO ('h'=1)('m'=2) INTO SEXO2.FORMATS SEXO2(F1.0).VAR LAB SEXO2 "Sexo empleado/a".

Sintaxi

VAL LAB SEXO2 1 'Home' 2 'Dona'.FRE SEXO2.

Menú

Page 18: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades7. Recodificació

Exemple 3: recodificació automàticaAUTORECODE VARIABLES=sexo /INTO sexo3

/PRINT.Sintaxi

Menú

Page 19: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades7. Recodificació

Exemple 4: categoritzador visual.

Procediment perProcediment per crear de manera personalitzada pintervals o classes (o categories) de valors

i blper a una variable quantitativa

Page 20: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades7. Recodificació

Exemple 4: categoritzador visual.

Després d’escollir la variable a la novavariable, a la nova finestra, si premem la variable, se’ns mostra un histograma de lesun histograma de les dades que tenim i se’ns ofereix, entre d’altres opcions lad altres opcions, la possibilitat de crear els punts de tall que vulguemvulguem

Page 21: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades7. Recodificació

Exemple 4: categoritzador visual.

Al nou quadre podem escollir tres opcions:- Intervals d’igual amplitud- Percentils iguals- Punts de tall a partir de la mitjana i les desviacions típiquesi les desviacions típiques.

Podem escollir crear punts de tall en funció dels percentils amb 2

d ll ò l dpunts de tall. Això vol dir que crearem quatre intervals, cadascun d’ells amb un 33,33% dels individus.individus.

Page 22: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades7. Recodificació

Exemple 4: categoritzador visual. Un cop premem Aplicares visualitza el resultat:- Ens indica els valors dels punts de tall.- Situa els punts sobre l’histograma.- Demana el nom de la- Demana el nom de la variable categoritzada: escollim, per exemple, salario_cat.- Si premem “Crear etiquetes”es generen automàticament.Amb “Aceptar” ensAmb Aceptar ens apareix la nova variable a la base de dades.

Page 23: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades7. Exercici de recodificació 1

Obriu l’arxiu Mundo 95 sav i feu una recodificació Obriu l arxiu Mundo 95.sav i feu una recodificació automàtica de la variable relig (religió majoritària) en una nova variable de nom relnum.

Ara recodifiqueu-la de nou en la variable relagrupper classificar les religions en tres tipus (cristianes, musulmanes i altres) amb les etiquetes següents:musulmanes i altres) amb les etiquetes següents:

1= cristianes (catòlica, ortodoxa, protestant) 2= musulmana

3 lt 3= altres

i completeu la identificació.

Page 24: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades7. Exercici de recodificació 1

Podeu comprovar que l’agrupació s’ha fet Podeu comprovar que l agrupació s ha fet correctament obtenint les freqüències de la variable:

relagrup Religió agrupada

1671493 32 1 32 4 32 41 C i tiVálidFrecuencia Porcentaje

Porcentajeválido

Porcentajeacumulado

1671493 32,1 32,4 32,4986407 19,0 19,1 51,5

2500103 48,1 48,5 100,05158003 99,2 100,0

1 Cristianes2 Musulmana3 AltresTotal

Válidos

, ,43900 ,8

5201903 100,0SistemaPerdidos

Total

Page 25: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades7. Exercici de recodificació 2

Obriu l’arxiu GSS93 reducido.sav i utilitzeu la recodificació per crear la variable edagrup amb la classificació en 3 categories de lacrear la variable edagrup amb la classificació en 3 categories de la variable edad (quantitativa) :

1 = joves (menys de 30) 2 = adults (entre 30 i 64)adu ts (e t e 30 6 ) 3 = grans (65 o més)

Poseu les etiquetes a la nova variable edagrup i tindrem la novavariable de tipus ordinal:

edagrup Edat agrupada

Porcentaje Porcentaje

279 18,6 18,6 18,6931 62,1 62,1 80,7290 19,3 19,3 100,0

1 Menys de 302 Entre 30 i 643 65 o més

VálidosFrecuencia Porcentaje válido acumulado

, , ,1500 100,0 100,0Total

Page 26: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades7. Exercici de recodificació 3

Obriu l’arxiu GSS93 reducido.sav i utilitzeu el t tit d i l l i bl d dcategotitzador visual per agrupar la variable edad en

quartils. Les freqüències de la nova variable són les següents:Les freqüències de la nova variable són les següents:

edat4 Edad del encuestado (Categorizada)

Porcentaje Porcentaje

374 24,9 25,0 25,0398 26,5 26,6 51,6362 24,1 24,2 75,9

1 <= 322 33 - 433 44 - 59

VálidosFrecuencia Porcentaje

Porcentajeválido

Porcentajeacumulado

362 24,1 24,2 75,9361 24,1 24,1 100,0

1495 99,7 100,05 ,3

1500 100 0

4 60+Total99 No contestaPerdidos

Total 1500 100,0Total

Page 27: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades8. Calcular

Comandament COMPUTE Crea noves variables a partir de transformacions Crea noves variables a partir de transformacions

numèriques d'altres ja existents, assignant-li un nom (target variable) a la qual li segueix una expressió de transformació:transformació:

COMPUTE target variable = expression Exemples:p

COMPUTE V5=V1+V2-V3COMPUTE V5=SQRT(A*A+B*B)COMPUTE V5 RND((V4/355)*100)COMPUTE V5=RND((V4/355)*100)COMPUTE V5='ASOCIACION'COMPUTE V5=V1

Cal després donar format a la variable (en particular Cal després donar format a la variable (en particular etiquetar les variables, i els valors, si s’escau)

Page 28: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades8. Calcular

Exemple. Sintaxi

FRE FECHNAC.COMPUTE EDAD=1994-XDATE.YEAR(FECHNAC).VAR LAB EDAD 'Edad empleado'.FORMAT EDAD(F2.0).FRE EDAD.

RECODE EDAD (LO THRU 30=1)(31 THRU 40=2)(41 THRU 50=3)(51 THRU HI=4) INTO EDAD2.

VAR LAB EDAD2 'EDAD EMPLEADO EN INTERVALOS'.VAL LAB EDAD2 1 'HASTA 30' 2 '31-40' 3 '41-50' 4 'MAS DE 50'.FORMATS EDAD2 (F1.0).FRE EDAD2.

Page 29: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades8. Calcular

Exemple Menú Exemple. Menú

Page 30: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades8. Exercici de càlcul

Obre la matriu Cultura.sav que conté dades d’una enquesta del CIRES (Centro ded una enquesta del CIRES (Centro de Investigaciones sobre la Realidad Social), l’abril de 1994, a una mostra representativa 1.200 persones de la població de 18 i més anys de l'Estatde la població de 18 i més anys de l Estat espanyol.

Crea una variable nova que contingui el nombre deCrea una variable nova que contingui el nombre de llibres total que llegeixen les persones entrevistades a partir de la suma de la informació de tres variables: c17 ‘llibres tècnics’ + c19 ‘bestde tres variables: c17 llibres tècnics + c19 best sellers’ + c21 ‘poesia’.

Una vegada creada, recodifica els valors perduts g , pen el valor 999, declara’l valor perdut de l’usuari i etiqueta’l.

Page 31: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades8. Exercici de càlcul

El resultat de les freqüències de la variable és:lliblleg Nombre llibres llegits

594 49 5 50 6 50 60VálidosFrecuencia Porcentaje

Porcentajeválido

Porcentajeacumulado

594 49,5 50,6 50,673 6,1 6,2 56,897 8,1 8,3 65,157 4,8 4,9 69,951 4,3 4,3 74,3

01234

Válidos

33 2,8 2,8 77,1: : : :1 ,1 ,1 99,32 ,2 ,2 99,51 1 1 99 6

5:536266 1 ,1 ,1 99,6

1 ,1 ,1 99,72 ,2 ,2 99,81 ,1 ,1 99,91 ,1 ,1 100,0

667098116211

1174 97,8 100,026 2,2

1200 100,0

Total999 NCPerdidos

Total

Page 32: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades9. Comptar aparicions

Comandament COUNT Crea noves variables a partir del recompte de

les vegades que apareix un o més valors, per a cada cas al llarg d’una sèrie de variablescada cas, al llarg d’una sèrie de variables.

COUNT varname=varlist(value list)

Exemple Sintaxi Exemple. SintaxiDATA LIST FREE /ORDINADO INTERNET DVD MOBIL.BEGIN DATA.0 0 0 0

X

1 0 1 11 1 1 10 0 0 11 1 0 11 1 1 1

1 14,31 14,31 14,32 28,62 28 6

,001,002,003,004 00

VálidosFrecuencia Porcentaje

0 0 1 1END DATA.COUNT X=ORDINADO INTERNET DVD MOBIL (1).FRE X.

2 28,67 100,0

4,00Total

Page 33: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades9. Comptar aparicions

Exemple. Menú

Page 34: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades9. Exercici de comptar aparicions

Amb les dades de la matriu Cultura.sav crea un índex de consum cultural a partir el recompte de quantes vegades un individu diu “sí” en relació a la realització de diversessí en relació a la realització de diverses pràctiques culturals, en concret: anar al cinema (b10), al teatre (b11), llegir diaris (b14), llegir ( ), ( ), g ( ), grevistes (b15) i llegir llibres (b16).

Abans d’efectuar el recompte, recodifica bl b laquestes variables amb valors 0 i 1,

respectivament, no o sí realitza l’activitat cultural en qüestiócultural en qüestió.

Page 35: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades9. Exercici de comptar aparicions

El resultat de les freqüències de la variable és: El resultat de les freqüències de la variable és:

index Índex de consum cultural

242 20,2 20,2 20,2232 19 3 19 3 39 5

01

VálidosFrecuencia Porcentaje

Porcentajeválido

Porcentajeacumulado

232 19,3 19,3 39,5290 24,2 24,2 63,7241 20,1 20,1 83,8147 12 3 12 3 96 0

1234 147 12,3 12,3 96,0

48 4,0 4,0 100,01200 100,0 100,0

45Total

Page 36: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades10. Generació de variables amb IF

IF realitza transformacions de les dades creant omodificant variables existents, numèriques omodificant variables existents, numèriques oalfanumèriques, a través de condicions lògiques ques'especifiquen en una expressió segons:

IF [(]logical expression[)] target variable=expressionIF [(]logical expression[)] target variable=expression Si l’expressió és vertadera executa l'assignació

expressada, en cas contrari converteix aquests casos envalors perduts del sistemavalors perduts del sistema.

Exemples:IF (CALIDAD EQ 1) V5=1IF (CALIDAD EQ 1) V5 1IF (CALIDAD GE 1) V5=2IF (V1 NE 0 AND V2 GT 96) V5=RND((V4/355)*100)IF (EDAD LE 25) EDAD2='Joves‘

Cal després etiquetar les variables (i els valors, sis’escau)

Page 37: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades10. Generació de variables amb IF

Exemple. Sintaxi

CROSS CATLAB BY SEXO2.IF (SEXO2=1 AND CATLAB=1) SEXCAT=1.IF (SEXO2=1 AND CATLAB=2) SEXCAT=2IF (SEXO2=1 AND CATLAB=2) SEXCAT=2.IF (SEXO2=1 AND CATLAB=3) SEXCAT=3.IF (SEXO2=2 AND CATLAB=1) SEXCAT=4.IF (SEXO2=2 AND CATLAB=2) SEXCAT=5.IF (SEXO2 2 AND CATLAB 2) SEXCAT 5.IF (SEXO2=2 AND CATLAB=3) SEXCAT=6.VAR LAB SEXCAT 'SEXO Y CATEGORIA'.VAL LAB SEXCAT 1 'Administrativo' 2 'Hombre seguridad' 3 'Directivo' 4 'Administrativa' 5 'Mujer seguridad' 6 'Directiva'. FORMAT SEXCAT(F1.0).FRE SEXCAT.

Page 38: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades10. Generació de variables amb IF

Exemple. Menú

Page 39: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades11. Generació de variables amb DO IF

DO IF realitza transformacions com IF però incorpora a més una estructura per a enllaçar diverses instruccionsmés una estructura per a enllaçar diverses instruccions, convertint-lo en un comandament molt més potent.

DO IF [(]logical expression[)]DO IF [(]logical expression[)]transformation commands[ELSE IF [(]logical expression[)]]transformation commands[ELSE IF [(]logical expression[)]]...[ELSE]transformation commandsEND IF

Page 40: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades11. Generació de variables amb DO IF

Exemple 1

DO IF (SEXO2=1).IF (CATLAB=1) SEXCAT2=1.IF (CATLAB=2) SEXCAT2=2IF (CATLAB=2) SEXCAT2=2.IF (CATLAB=3) SEXCAT2=3.ELSE IF (SEXO2=2).IF (CATLAB=1) SEXCAT2=4.IF (CATLAB=2) SEXCAT2=5.IF (CATLAB=3) SEXCAT2=6.END IF.VAR LAB SEXCAT2 'SEXO Y CATEGORIA 2'.VAL LAB SEXCAT2 1 'Administrativo' 2 'Hombre seguridad' 3 'Directivo'

4 'Administrativa' 5 'Mujer seguridad' 6 'Directiva'. FORMAT SEXCAT2(F1 0)FORMAT SEXCAT2(F1.0).FRE SEXCAT2.

Page 41: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades11. Generació de variables amb DO IF

Exemple 2DO IF (SEXO2=1).

+ DO IF (CATLAB=1).+ COMPUTE SEXCAT3=1.+ ELSE IF (CATLAB=2).+ COMPUTE SEXCAT3=2.+ ELSE.+ COMPUTE SEXCAT3=3.+ END IF.ELSE IF (CATLAB=1)ELSE IF (CATLAB=1).COMPUTE SEXCAT3=4.ELSE IF (CATLAB=2).COMPUTE SEXCAT3=5.ELSE.COMPUTE SEXCAT3=6.END IF.VAR LAB SEXCAT3 'SEXO Y CATEGORIA 3'.VAL LAB SEXCAT3 1 'Administrativo' 2 'Hombre seguridad' 3 'Directivo'

4 'Administrativa' 5 'Mujer seguridad' 6 'Directiva'. FORMAT SEXCAT3(F1.0).FRE SEXCAT3.

Page 42: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades10. Exercici de generació amb IF

Construïu una tipologia de mobilitat educativa que anomenarem mobilita a partir de la combinació de valors de dues variables que has de recodificar prèviament: ‘estudis’ (estudis de la personahas de recodificar prèviament: estudis (estudis de la persona entrevistada, l’ego, a partir de l’e21) i ‘estpares’ (estudis del pare de la persona entrevistada, a partir d’e22).

Els criteris de recodificació són els següents:g

Valors antics (e21/e22) Valors nous (estudis/estpares)

0 No sabe leer 1. Sense estudis

1 Sabe leer1 Sabe leer

2 Primarios 2. Estudis primaris

5 Bachiller elemental

3 FP 1er grado 3. Estudis secundaris3 e g ado 3. stud s secu da s

4 FP 2 grado

6 Bachiller superior

7 Grado medio 4. Estudis universitaris

8 Superiores

9 Sin respuesta 9. Sense resposta

Page 43: Pedro López Roldán - UAB Barcelona...crear la variablecrear la variable edagrup amb la classificació en 3 categories de laamb la classificació en 3 categories de la variable edad

Transformacions de les dadesTransformacions de les dades10. Exercici de generació amb IF

La tipologia combinarà els valors amb els criteris següents:

Mobilitat educativa

Porcentaje Porcentaje

La taula de freqüències de la nova variable

782 65,2 68,0 68,072 6,0 6,3 74,3

275 22,9 23,9 98,221 1 8 1 8 100 0

Reproducció baixaReproducció altaMobilitat ascendentMobilitat descendent

VálidosFrecuencia Porcentaje

Porcentajeválido

Porcentajeacumulado

que s’obté és:21 1,8 1,8 100,0

1150 95,8 100,050 4,2

1200 100,0

Mobilitat descendentTotalNCPerdidos

Total