1
ESTADÍSTICA DESCRIPTIVA CON SPSS (2602) Estadística Económica
Joaquín Alegre y Magdalena Cladera
SPSS es una aplicación para el análisis estadístico. En este material se
presentan los procedimientos básicos de este programa para la gestión y el
análisis descriptivo de datos. Concretamente, los contenidos son los siguientes:
1. Entorno de trabajo .........................................................................1
2. Etiquetado de las variables y los valores .......................................4
3. Selección de casos ........................................................................7
4. Transformación de las variables ....................................................9
5. Análisis descriptivo de variables cualitativas................................12
6. Análisis descriptivo de variables cuantitativas .............................15
6.1. Distribución de frecuencias e histograma .............................15
6.2. Estadísticos descriptivos ......................................................15
7. Asociación de variables cualitativas.............................................21
8. Correlación...................................................................................24
1. ENTORNO DE TRABAJO Tipos de archivos
- Archivos de datos. Extensión .sav.
- Resultados: Extensión .spo.
- Sintaxis: Extensión .sps.
Importación de datos desde Excel Es suficiente con abrir el archivo desde SPSS. Si el archivo tiene varias hojas
debe indicarse cual es la que quiere utilizarse, así como el rango de celdas en
el que se encuentran los datos que desean importarse, si éste es distinto al que
aparece por defecto. Una vez abierto, se guarda con extensión .sav.
Ejemplo 1. En la Figura 1, Figura 2 y Figura 3 se presentan los pasos a seguir
para abrir el archivo EDT02.xls desde SPSS.
3
Figura 3
Exportación de datos a Excel Es suficiente con, desde SPSS, guardar el archivo que se desea exportar con
extensión *.xls.
Ejemplo 2. En la Figura 4 y la Figura 5 se presentan los pasos a seguir para
guardar el archivo EDT02.sav como archivo de Excel.
Figura 4
4
Figura 5
2. ETIQUETADO DE LAS VARIABLES Y LOS VALORES Cada una de las variables de una base de datos de SPSS tiene un nombre que
puede tener hasta ocho caracteres. Un nombre tan corto puede ser poco
informativo, de manera que resulta conveniente especificar, además, una
etiqueta para la variable, es decir, una definición que permita identificar
fácilmente su contenido.
Por otra parte, también es de gran utilidad a la hora de interpretar los
resultados de los análisis estadísticos, tener etiquetados los valores de las
variables cualitativas, es decir, asociar a cada uno de los valores una definición
que exprese su significado.
Vista de datos y Vista de variables En un archivo de datos de SPSS hay dos pestañas:
- Vista de datos (Figura 6), en la que se tienen los valores de las variables
para cada observación.
- Vista de variables (Figura 7), en la que se presenta la información sobre
diversas características de las variables (nombre, tipo, anchura,
decimales, etiqueta, valores perdidos, columnas, alineación, medida).
5
Figura 6
Figura 7
El etiquetado de las variables y los valores se lleva a cabo desde la pestaña
Vista de variables, tal y como se explicará a continuación.
6
Etiquetado de las variables El etiquetado de una variable consiste en especificar una definición, lo más
breve y clara posible, que permita identificar con claridad el significado de dicha
variable.
Ejemplo 3. En la Figura 8 se muestra como la variable días se ha etiquetado
con la expresión Días de estancia en las Islas.
Figura 8
Etiquetado de los valores Las categorías de una variable cualitativa suelen representarse por valores
numéricos. El etiquetado de los valores consiste en especificar para cada uno
de ellos una breve definición que permita identificar cual es la categoría de la
variable que representan.
Ejemplo 4. En la Figura 9 se muestra el procedimiento de etiquetado de los
valores de la variable edad, para indicar que el valor 1 se corresponde con
Menores de 30 años, el valor 2 con Entre 30 y 45 años, etc.
Haciendo clic se puede modificar el nombre de la variable Haciendo clic se puede
escribir la etiqueta de la variable
7
Figura 9
3. SELECCIÓN DE CASOS En ocasiones interesa trabajar sólo con una parte de los datos, con aquellos
que cumplen determinadas características, para lo que es útil la opción
Seleccionar casos del menú Datos.
Ejemplo 5. De la Figura 10 a la Figura 12 se muestra como se seccionarían las
observaciones correspondientes a los turistas menores de 30 años.
Figura 10
1
2
8
Figura 11
Figura 12
Para volver a trabajar con todas las observaciones se activa la opción Todos
los casos en el cuadro de diálogo de la Figura 13.
En este cuadro se escribe la condición que deben cumplir los datos que se van a seleccionar
!!! Si se activa esta opción se perderán de forma irrecuperable todas las observaciones que no se seleccionen
9
Figura 13
4. TRANSFORMACIÓN DE LAS VARIABLES Las opciones Calcular y Recodificar del menú Transformar permiten realizar
transformaciones en las variables o crear nuevas variables a partir de las ya
existentes en la base de datos.
Ejemplo 6. En la Figura 14 se ilustra como utilizar la opción Calcular para
obtener una variable que contenga el gasto en euros (geuros) a partir de la
variable de gasto en pesetas (gtotal).
10
Figura 14
La opción Recodificar permite, por ejemplo, agrupar un conjunto de valores de
una variable categórica, agrupar en intervalos una variable cuantitativa,
cambiar la codificación de los valores, etc.
Existen dos opciones:
- Recodificar en la misma variable. Se substituye la variable original por
la/s variable/s recodificada/s.
- Recodificar en distintas variables. Se mantiene la variable original y se
añade/n la/s variable/s con la nueva codificación.
Ejemplo 7. De la Figura 15 a la Figura 17 se muestra el procedimiento a seguir
para recodificar la variable nacionalidad, de manera que los valores superiores
a 4 queden recogidos en una única categoría representada por el valor 5. En
primer lugar se selecciona Recodificar En distintas variables del menú
Transformar.
Expresión utilizada para el cálculo de la nueva variable
Nombre de la nueva variable
11
Figura 15
Figura 16
Figura 17
1 2
3
Nombre y etiqueta de la nueva variable
1
2
Los valores superiores a 4 en la variable original
Tomarán valor 5 en la variable recodificada
El resto de valores (1 a 4) de la variable original
Se quedan igual en la variable recodificada
12
Si en algún momento se quiere un resumen de las variables contenidas en una
base de datos de SPSS, sus características y su etiquetado, se puede obtener
seleccionando la opción Mostrar información de datos del menú Archivo, o bien
seleccionando la opción Información del archivo del menú Utilidades.
Por otra parte, para ver en la base de datos las etiquetas de los valores, se
tiene que seleccionar la opción Etiquetas de valor en el menú Ver.
5. ANÁLISIS DESCRIPTIVO DE VARIABLES CUALITATIVAS La opción Frecuencias del menú Analizar Estadísticos Descriptivos permite
obtener distribuciones de frecuencias, representaciones gráficas de dichas
distribuciones, y los estadísticos descriptivos más utilizados.
Ejemplo 8. De la Figura 18 a la Figura 22 se expone el procedimiento a seguir
para realizar un análisis descriptivo básico de la variable edad. Los resultados
que se obtienen son los de la Figura 23.
Figura 18
1
2
3
14
Figura 22
Figura 23
Estadísticos
EDAD575
32,00
1
VálidosPerdidos
N
MedianaModa
EDAD
263 45,5 45,7 45,7204 35,3 35,5 81,2
87 15,1 15,1 96,321 3,6 3,7 100,0
575 99,5 100,03 ,5
578 100,0
MENOS DE 30 AÑOSENTRE 30 Y 45ENTRE 45 y 60MÁS DE 60 AÑOSTotal
Válidos
SistemaPerdidosTotal
Frecuencia PorcentajePorcentaje
válidoPorcentajeacumulado
EDAD
Perdido
MÁS DE 60 AÑOS
ENTRE 45 y 60
ENTRE 30 Y 45
MENOS DE 30 AÑOS
15
6. ANÁLISIS DESCRIPTIVO DE VARIABLES CUANTITATIVAS
6.1. Distribución de frecuencias e histograma Para obtener la distribución de frecuencias de una variable cuantitativa es
conveniente agrupar los valores en intervalos. Posteriormente puede obtenerse
la distribución de frecuencias y su representación gráfica de la forma descrita
en el epígrafe anterior.
Otra forma de representar gráficamente la distribución de frecuencias de una
variable cuantitativa es mediante un histograma. Para obtenerlo puede
utilizarse una de estas dos alternativas:
- Se sigue el procedimiento descrito en el epígrafe 5, y en el cuadro de
diálogo de la Figura 21 se activa la opción Histogramas.
- Se selecciona la opción Histograma del menú Gráficos.
En ambos casos se obtiene el mismo resultado.
Ejemplo 9. En la Figura 24 se tiene el histograma del gasto total.
Figura 24
GASTO TOTAL PC Y DIA
25000,0
23000,0
21000,0
19000,0
17000,0
15000,0
13000,0
11000,0
9000,0
7000,0
5000,0
3000,0
1000,0
GASTO TOTAL PC Y DIA
Frec
uenc
ia
60
50
40
30
20
10
0
Desv. típ. = 4720,52 Media = 10353,9
N = 535,00
6.2. Estadísticos descriptivos El procedimiento expuesto en el epígrafe 5 también permite obtener los
principales estadísticos descriptivos de una variable cuantitativa. Los
estadísticos que interese obtener se seleccionan en el cuadro de diálogo de la
Figura 19.
Alternativamente, se puede utilizar la opción Estadísticos descriptivos
Descriptivos del menú Analizar.
16
Ejemplo 10. Para obtener un resumen de los principales estadísticos
descriptivos de la variable días puede procederse de la forma que se muestra
en la Figura 25 y la Figura 26. Los resultados que se obtienen son los de la
Figura 27.
Figura 25
Figura 26
17
Figura 27
Estadísticos descriptivos
57828
230
10,19 ,173,983
15,862,882 ,102
1,892 ,203578
NRangoMínimoMáximoMediaDesv. típ.VarianzaAsimetríaCurtosisN
DÍAS DE ESTANCIA
N válido (según lista)
Estadístico Error típico
Otra alternativa, algo más completa que las anteriores, consiste en seleccionar
la opción Estadísticos descriptivos Explorar del menú Analizar. Esta opción
permite obtener un resumen de los principales estadísticos descriptivos de
posición central y de dispersión, percentiles, valores extremos, y
representaciones gráficas como el histograma o el diagrama de caja.
Ejemplo 11. De la Figura 28 a la Figura 31 se muestra la utilización de la
opción Explorar para obtener los principales instrumentos que permiten realizar
un análisis descriptivo de la variable días. Los resultados que se obtienen son
los de la Figura 32.
Figura 28
19
Figura 32
Explorar Resumen del procesamiento de los casos
578 100,0% 0 ,0% 578 100,0%DÍAS DE ESTANCIAN Porcentaje N Porcentaje N Porcentaje
Válidos Perdidos TotalCasos
Descriptivos
10,19 ,1669,86
10,51
10,078,00
15,8623,983
23028
7,00,882 ,102
1,892 ,203
MediaLímite inferiorLímite superior
Intervalo de confianzapara la media al 95%
Media recortada al 5%MedianaVarianzaDesv. típ.MínimoMáximoRangoAmplitud intercuartilAsimetríaCurtosis
DÍAS DE ESTANCIAEstadístico Error típ.
Percentiles
6,007,007,008,00
14,0014,0014,00
7,008,00
14,00
5102550759095255075
DÍAS DE ESTANCIA
DÍAS DE ESTANCIA
Promedioponderado(definición 1)
Bisagras de Tukey
20
Valores extremos
307 30331 30340 3043 21
102 21a
360 2111 2110 2550 3540 3b
1234512345
Mayores
Menores
DÍAS DE ESTANCIA
Númerodel caso Valor
En la tabla de valores extremos mayores sólo se muestrauna lista parcial de los casos con el valor 21.
a.
En la tabla de valores extremos menores sólo se muestrauna lista parcial de los casos con el valor 3.
b.
DÍAS DE ESTANCIA
DÍAS DE ESTANCIA
30,027,5
25,022,5
20,017,5
15,012,5
10,07,5
5,02,5
Histograma
Frec
uenc
ia
300
200
100
0
Desv. típ. = 3,98 Media = 10,2
N = 578,00
578N =
DÍAS DE ESTANCIA
40
30
20
10
0
-10
340331307
21
7. ASOCIACIÓN DE VARIABLES CUALITATIVAS La distribución de frecuencias conjunta de dos variables cualitativas, así como
las medidas estadísticas que permiten analizar su asociación, tanto si se trata
de variables nominales como de variables ordinales, se pueden obtener
mediante la opción Descriptivos Tablas de contingencia del menú Analizar.
Ejemplo 12. El procedimiento a seguir para el análisis de la asociación entre la
edad y la intención de retorno se muestra en la Figura 33 a la Figura 36. Los
resultados que se obtendrían son los presentados en la Figura 37.
Figura 33
23
Figura 36
Figura 37
Resumen del procesamiento de los casos
543 93,9% 35 6,1% 578 100,0%
PIENSA VOLVER APASAR LASVACACIONES ENNUESTRA ISLA * EDAD
N Porcentaje N Porcentaje N PorcentajeVálidos Perdidos Total
Casos
Tabla de contingencia PIENSA VOLVER A PASAR LAS VACACIONES EN NUESTRA ISLA * EDAD
205 158 73 17 453208,6 156,8 70,9 16,7 453,0
45,3% 34,9% 16,1% 3,8% 100,0%
82,0% 84,0% 85,9% 85,0% 83,4%37,8% 29,1% 13,4% 3,1% 83,4%
45 30 12 3 9041,4 31,2 14,1 3,3 90,0
50,0% 33,3% 13,3% 3,3% 100,0%
18,0% 16,0% 14,1% 15,0% 16,6%8,3% 5,5% 2,2% ,6% 16,6%
250 188 85 20 543250,0 188,0 85,0 20,0 543,0
46,0% 34,6% 15,7% 3,7% 100,0%
100,0% 100,0% 100,0% 100,0% 100,0%46,0% 34,6% 15,7% 3,7% 100,0%
RecuentoFrecuencia esperada% de PIENSAVOLVER A PASARLAS VACACIONESEN NUESTRA ISLA% de EDAD% del totalRecuentoFrecuencia esperada% de PIENSAVOLVER A PASARLAS VACACIONESEN NUESTRA ISLA% de EDAD% del totalRecuentoFrecuencia esperada% de PIENSAVOLVER A PASARLAS VACACIONESEN NUESTRA ISLA% de EDAD% del total
SI
NO
PIENSA VOLVER APASAR LASVACACIONES ENNUESTRA ISLA
Total
MENOS DE30 AÑOS
ENTRE30 Y 45
ENTRE45 y 60
MÁS DE60 AÑOS
EDAD
Total
24
Pruebas de chi-cuadrado
,826a 3 ,843,835 3 ,841
,738 1 ,390
543
Chi-cuadrado de PearsonRazón de verosimilitudAsociación lineal porlinealN de casos válidos
Valor glSig. asintótica
(bilateral)
1 casillas (12,5%) tienen una frecuencia esperada inferior a 5.La frecuencia mínima esperada es 3,31.
a.
Medidas direccionales
,000 ,000 .b .b
,000 ,000 .b
.b
,000 ,000 .b .b
,002 ,003 ,844c
,001 ,002 ,765c
SimétricaPIENSA VOLVER APASAR LASVACACIONES ENNUESTRA ISLAdependienteEDAD dependientePIENSA VOLVER APASAR LASVACACIONES ENNUESTRA ISLAdependienteEDAD dependiente
Lambda
Tau de Goodmany Kruskal
Nominalpor nominal
ValorError típ.
asint.a T aproximadaSig.
aproximada
Asumiendo la hipótesis alternativa.a.
No se puede efectuar el cálculo porque el error típico asintótico es igual a cero.b.
Basado en la aproximación chi-cuadrado.c.
Medidas simétricas
,039 ,843
543
Coeficiente decontingencia
Nominal pornominalN de casos válidos
ValorSig.
aproximada
Asumiendo la hipótesis alternativa.a.
Empleando el error típico asintótico basado en la hipótesisnula.
b.
8. CORRELACIÓN Para obtener una matriz de correlaciones entre dos o más variables se dispone
de la opción Correlaciones Bivariadas del menú Analizar.
Ejemplo 13. En la Figura 38 se tiene el cuadro de diálogo utilizado para
solicitar la matriz de correlaciones de las variables de satisfacción, y en la
Figura 39 se tienen los resultados obtenidos.
26
Figura 39
Correlaciones
1 ,417** ,481** ,472** ,314** ,342**. ,000 ,000 ,000 ,000 ,000
531 509 491 491 498 458,417** 1 ,273** ,390** ,199** ,207**,000 . ,000 ,000 ,000 ,000509 533 504 506 513 476,481** ,273** 1 ,520** ,223** ,214**,000 ,000 . ,000 ,000 ,000
491 504 514 500 498 464
,472** ,390** ,520** 1 ,280** ,297**,000 ,000 ,000 . ,000 ,000491 506 500 514 499 467,314** ,199** ,223** ,280** 1 ,761**,000 ,000 ,000 ,000 . ,000498 513 498 499 522 474,342** ,207** ,214** ,297** ,761** 1,000 ,000 ,000 ,000 ,000 .458 476 464 467 474 481
Correlación de PearsonSig. (bilateral)NCorrelación de PearsonSig. (bilateral)NCorrelación de PearsonSig. (bilateral)N
Correlación de PearsonSig. (bilateral)NCorrelación de PearsonSig. (bilateral)NCorrelación de PearsonSig. (bilateral)N
NIVEL DE SATISFACCIÓNGLOBAL
NIVEL DE SATISFACCIÓNPLAYAS
NIVEL DE SATISFACCIÓNCALIDAD ALOJAMIENTO
NIVEL DE SATISFACCIÓNCALIDADMEDIOAMBIENTE
NIVEL DE SATISFACCIÓNPRECIO COMIDAS
NIVEL DE SATISFACCIÓNPRECIO OCIO
NIVEL DESATISFACCIÓN GLOBAL
NIVEL DESATISFACCIÓN PLAYAS
NIVEL DESATISFACCIÓ
N CALIDADALOJAMIENT
O
NIVEL DESATISFACCIÓ
N CALIDADMEDIOAMBIE
NTE
NIVEL DESATISFACCIÓN PRECIOCOMIDAS
NIVEL DESATISFACCIÓN PRECIO
OCIO
La correlación es significativa al nivel 0,01 (bilateral).**.