Curso de Apoyo y Síntesis:
description
Transcript of Curso de Apoyo y Síntesis:
1
Curso de Apoyo y Síntesis:
Facultad de CCPP y Sociología UCMDto. Sociología IV
Becario de Colaboración: 2009/2010S. Christian Orgaz Alonso
ATENCIÓN: Material incompleto pendiente de revisión, no distribuir.
No es una versión final, pendiente de inserción de referencias bibliográficas,
corrección final, etc. NO DISTRIBUIR. MATERIAL INCOMPLETO sujeto a erratas, errores y omisiones.
2
[email protected] del grupo (comunicación y envíos):
http://groups.google.com/group/spss2010
Dirección del grupo (descarga de archivos, en adelante esta función la suplirá la página pbwork):
Correo personal (comentarios, dudas individuales…):
http://spss2009.pbworks.com/
Página “pbwork”(diario del curso y descarga de archivos):
3
ÍNDICEUNIDAD 1:
APROXIMACIÓN AL ENTRONO SPSSUNIDAD 2:
ANALISIS UNIVERIABLEUNIDAD 3:
TRAMIENTO DE LOS DATOSUNIDAD 4:
TABLAS DE CONTINGENCIA UNIDAD 5:
COMPARACIÓN DE MEDIASUNIDAD 6:
CORRELACIÓN
5
UNIDAD 0Conocimiento y “realidad”
Supuestos: ontológicos, epistemológicos, lo ideológico y la ciencia. La construcción del dato y las implicaciones del conocimiento. De la “realidad” a la base de datos, propuestas de aproximación.
6
UNIDAD 1APROXIMACIÓN AL ENTRONO SPSS
Variables, medidas, escalas. Definición de conceptos. Clasificación de variables. Codificación (de preguntas a variables). Presentación del entorno SPSS. Construcción de la matriz de datos.
8
NIVEL DE MEDICIÓN DE LAS VARIABLES (I)
NOMINAL
ORDINAL
INTERVALORAZÓN
““CUALITATIVAS”” ““CUANTITATIVAS””
Elaboración: S. Christian Orgaz Alonso, 2009
9
NIVEL DE MEDICIÓN DE LAS VARIABLES (I)
NOMINAL
ORDINAL
INTERVALORAZÓN
““CUALITATIVAS”” ““CUANTITATIVAS””
Elaboración: S. Christian Orgaz Alonso, 2009
Sexo Clase Social Grados Centígrados Edad
10
NIVEL DE MEDICIÓN DE LAS VARIABLES (I)
NOMINAL
ORDINAL
INTERVALORAZÓN
Clasificación
OrdenClasificación
DistanciaOrdenClasificación
0 AbsolutoDistanciaOrdenClasificación
““CUALITATIVAS”” ““CUANTITATIVAS””
Sexo Clase Social Grados Centígrados Edad
Elaboración: S. Christian Orgaz Alonso, 2009
11
VARIABLES FICTICIAS O “DUMMY” (II)
DUMMY
Elaboración: S. Christian Orgaz Alonso, 2009
Variables Nominales u Ordinales
Sexo:Hombre = 1Mujer = 2
Sexo:Hombre = 1No Hombre = 0
---------------------------------Mujer = 1No Mujer = 0
Estado Civil:Soltero = 1Casado = 2Divorciado = 3
Estado Civil:Con pareja = 1Sin pareja= 0
12
NIVEL DE RELACIÓN DE LAS VARIABLES (II) [Dependencia estadística, Contraste de Hipótesis]
INDEPENDIENTE/S DEPENDIENTE
Elaboración: S. Christian Orgaz Alonso, 2009
INTERVINIENTES
¿Nominal, Ordinal o Intervalo Razón?
ESPURIAS
¿Nominal, Ordinal o Intervalo Razón?
Tipo de pruebaDe significación
Latentes
Un ejemplo de una relación espuria puede ser ilustrado examinando las ventas de helados de una ciudad. Éstas son más altas cuando la tasa de sofocam”ientos” es mayor. Sostener que la venta de helados causa los sofocamientos sería implicar una relación espuria entre las dos. En realidad, una ola de calor puede haber causado ambas. La ola de calor es un ejemplo de variable no tenida en cuenta en este planteamiento, es decir, debido a esta variable la relación entre helados y “sofocamiento” es una relación espuria. (Fuente: Wikipedia)
13
ESQUEMA BIVARIABLE y MULTIVARIABLE
(Nominal/Ordinal)*
(Nominal/Ordinal)
(Nominal/Ordinal)*
Numérica o Sólo numérica
Numérica/s*
Numérica/s
Chi-Cuadrado Contraste de Medias y
Anova
Correlación (También
categórica) y Técnicas Multivariables
Elaboración: S. Christian Orgaz Alonso, 2009
Tema IV Tema V Tema VI-VII-VIII
14
CRITERIO DE ORDENACIÓN DE LAS PRUEBAS ESTADÍSTICAS
RELACIONES entre Variables
Tabla Contingencia (Categórica * Categórica)
Correlaciones (Numérica * Numérica/Categórica)
Regresión Lineal (Numerica Numérica [y Dummy])
COMPARAR GRUPOS o Variables
Elaboración: S. Christian Orgaz Alonso, 2009
Medias (Numérica [en realidad no es una prueba estadística, sólo es descriptivo])
Medias independientes (Numérica * Categórica)
Medias relacionadas (Numérica * Numérica)
Anova de un factor (Numérica * Categórica [> o = a 3 categorías])
16
Identifica para cada pregunta el número de variables que resultan al codificarla, así como el número de categorías de cada variable.
17
DE PREGUNTAS A VARIABLES
¿Cuántas variables, de qué tipo, cuántas categorías?
Material docente de Carlos De la Puente Viedmahttp://www.ucm.es/info/socivmyt/paginas/profesorado/perfiles2.htm#puente
18
¿Cuántas variables, de qué tipo, cuántas categorías?
DE PREGUNTAS A VARIABLES
Material docente de Carlos De la Puente Viedmahttp://www.ucm.es/info/socivmyt/paginas/profesorado/perfiles2.htm#puente
19
¿Cuántas variables, de qué tipo, cuántas categorías?
DE PREGUNTAS A VARIABLES
Material docente de Carlos De la Puente Viedmahttp://www.ucm.es/info/socivmyt/paginas/profesorado/perfiles2.htm#puente
20
¿Cuántas variables, de qué tipo, cuántas categorías?
DE PREGUNTAS A VARIABLES
Material docente de Carlos De la Puente Viedmahttp://www.ucm.es/info/socivmyt/paginas/profesorado/perfiles2.htm#puente
21
¿Cuántas variables, de qué tipo, cuántas categorías?
DE PREGUNTAS A VARIABLES
Material docente de Carlos De la Puente Viedmahttp://www.ucm.es/info/socivmyt/paginas/profesorado/perfiles2.htm#puente
22
Creación de una matriz de datos a partir de los distintos modelos de preguntas presentados anteriormente.
Nombre Archivo “01_Ejercicio de Codificación”
23
Creación de una matriz de datos:
Pasos:1º) Definición y creación de las variables
(“Vista de Variables”(SPSS)), en función del libro de códigos)
2º) Introducción de datos (“vista de datos”(SPSS))
Elaboración: S. Christian Orgaz Alonso, 2009
24
ID:01Sexo: HombreEdad:23Estudios: MediosValoración: 7Ocio: TV
ID:02Sexo: MujerEdad:22Estudios: AltosValoración: 8 Ocio: Videojuegos
ID:03Sexo: MujerEdad:25Estudios: NCValoración: 4 Ocio: Lectura
ID:04Sexo: HombreEdad:24Estudios: AltosValoración: 8Ocio: Beber Cerveza
ID:05Sexo: “12” “ “Edad:24Estudios: BajosValoración: 3Ocio:
ID:06Sexo: MujerEdad:Estudios: MediosValoración: 5Ocio: TV
DE PREGUNTAS A VARIABLES Ejercicio de codificación en SPSS
V1: Nombre Id V2: Sexo
Categorías:Hombre = 1Mujer = 2
V3: Edad (en años)
V4: Estudios:Categorías:
Bajos = 1 Medios = 2Altos = 3Ns/Nc = 9
V5: Valoración del Interés:De 0 (mínimo) a 10 (máximo)
V6: Ocio: (Variable abierta/cadena)Ponemos el texto “tal cual”.
CUESTIONARIOS A CODIFICARLIBRO DE CÓDIGOS
Nombre Archivo “01_Ejercicio de Codificación” Elaboración: S. Christian Orgaz Alonso, 2009
25
Análisis descriptivo (univariable) de los datos, medidas de tendencia central, dispersión y forma. Representaciones gráficas mediante SPSS (barras, histogramas).
UNIDAD 2ANALISIS UNIVERIABLE
26
CASOS PERDIDOS i
Tipos de casos perdidos:a) Por el Sistema.b) Por el Usuario.c) Errores y “”Casos Atípicos””.
Elaboración: S. Christian Orgaz Alonso, 2009
29
VALORES PERDÍDOS y CASOS ATÍPICOS
Casos atípicos o erróneos (localización)
1) Mediante tabla de Frecuencias.a) Información de las Variablesb) “Buscar”c) “Recodificar”.
2) Mediante comandos Datos/Identificar casos atípicos
oAnalizar/Descriptivos/Explorar
(Análisis Exploratorio)
Elaboración: S. Christian Orgaz Alonso, 2009
30
Localización y tratamiento:1) Cómo es la variable, forma (utilidades) y contenido (tabla de
frecuencias)2) Localizar casos no validos (utilidades o recode)3) Tratamiento: Eliminar, imputar…
CASOS PERDIDOS
32
Tipos de Estadísticos:a) Tendencia Central.b) Dispersión.c) Frecuencias
ESTADÍSTICOS Y RELACIÓN CON LAS VARIABLES
33
Elaboración: Asier A
mezaga Etxebarría y
S. Christian O
rgaz Alonso, 2009
Nominal Ordinal Intervalo/Razón
Tendencia CentralModa X X X
Mediana X XMedia X
DispersiónDesviación Típica X
Varianza XCV X
Decil, Cuartil, Percentil XForma
Asimetría XKurtosis X
Tabla de Frecuencia X X XGrafico Barras y sectores X X XHistograma XDiagrama Caja X
34
DIFERENCIA ENTRE GRÁFICO DE BARRAS E HISTOGRAMA
No hay distancia = Nominal/Ordinal HAY distancia = Numéricas Sexo Edad
DIAGRAMA DE BARRAS HISTOGRAMA
Elaboración: S. Christian Orgaz Alonso, 2009
35
Aplicación de estadísticos y gráficos en función del tipo de variable y lectura, para el archivo creado anteriormente.
36
UNIDAD 3TRAMIENTO DE LOS DATOS
Codificación y Recodificación de variables. Comandos de transformación/creación de variables -Compute, If y Recode-. Creación de índices y escalas. Filtros y selección de casos. Ponderación. Lectura de ficheros de datos: Importar, Exportar, Fundir archivos y Microdatos. Depuración de la matriz de datos. Tratamiento de la no respuesta y de la múltiple respuesta. Protocolo de explotación e interpretación de datos con estadísticos descriptivos.
Elaboración: S. Christian Orgaz Alonso, 2009
37
Tipos de Tablas de Frecuencias:Tipo I: Un caso = Un valor.Tipo II: Un valor = varios casos.Tipo III: Un intervalo de valores = varios casos.
TIPOS DE TABLAS DE FRECUENCIA
Elaboración: S. Christian Orgaz Alonso, 2009
38
TIPOS DE TABLAS DE FRECUENCIAS
T.1. Matriz de Datos: Un Caso = Caso
Elaboración: S. Christian Orgaz Alonso, 2009
39
TIPOS DE TABLAS DE FRECUENCIAS
T.2. Matriz Agrupada por Frecuencias: Un Valor = Varios Casos
Edad
1 14,3 14,3 14,32 28,6 28,6 42,92 28,6 28,6 71,41 14,3 14,3 85,71 14,3 14,3 100,07 100,0 100,0
2122232426Total
ValidFrequency Percent Valid Percent
CumulativePercent
Sexo
2 33,3 40,0 40,03 50,0 60,0 100,05 83,3 100,01 16,76 100,0
HombreMujerTotal
Valid
SystemMissingTotal
Frequency Percent Valid PercentCumulative
Percent
Elaboración: S. Christian Orgaz Alonso, 2009
40
TIPOS DE TABLAS DE FRECUENCIAS
T.3. Matriz Agrupada por Intervalos: Un Intervalo de Valores = Varios Casos
Edad codificada en grupos
2 33,3 40,0 40,03 50,0 60,0 100,05 83,3 100,01 16,76 100,0
De 22 a 23 añosDe 24 a 25 añosTotal
Valid
SystemMissingTotal
Frequency Percent Valid PercentCumulative
Percent
CÓMO SE HACE EN SPSS???? = Transformar / …
Elaboración: S. Christian Orgaz Alonso, 2009
41
RECODIFICACIÓN DE VARIABLES (C): Recodificación Automática (Cerrando variables abiertas)
Ejercicio:Asigna a la variable “Ocio” un valor para cada categoría.
42
Tipos :a) En la misma variable.b) En distintas variables.c) Automática
RECODIFICACIÓN DE VARIABLES(Recode)
Elaboración: S. Christian Orgaz Alonso, 2009
44
RECODIFICACIÓN DE VARIABLES (A):
Transforma la variable edad en una variable categórica con dos categorías, de forma que la primera categoría agrupe los valores de edad 22 y 23 años y la segunda categoría agrupe los valores 24 y 25 años)
Edad codificada en grupos
2 33,3 40,0 40,03 50,0 60,0 100,05 83,3 100,01 16,76 100,0
De 22 a 23 añosDe 24 a 25 añosTotal
Valid
SystemMissingTotal
Frequency Percent Valid PercentCumulative
Percent
45
Tipos :a) RECODE (Analizar/Trasformar)b) COMPUTE (Analizar/Calcular)c) IF (Analizar/Calcular-Si…)
RECODIFICACIÓN DE VARIABLESY OPERACIONALIZACIÓN
Elaboración: S. Christian Orgaz Alonso, 2009
46
Creación y Recodificación de Variables: Ejercicio: (Archivo “04_Venta de casas por barrios”)
1º Recodificar los barrios en tres categorías. (RECODE)2º Añadir al precio de venta de cada casa 3000€ de gastos de notaría. (COMPUTE)3º Calcular el impuesto que graba cada uno de los tres barrios agrupando las casas en tres grupos en función del del impuesto. (IF)
Clase Alta = +9000 (Casa 1)Clase Media = +6000 (Casas 2,3,4)Clase Baja = - 2000 (Casas 5,6,7)
4º ¿Qué tipo de variable obtenemos y qué estadísticos podemos aplicar?
47
Creación y Recodificación de Variables:
Ejercicio: (Archivo “03_ENI_EDAD ”)
¿Cómo sustituir los valores erróneos de la variable sexo?
48
Tipos :a) Selección mediante condición b) Mediante variable filtrod) Selección aleatoriac) Rango de tiempo o casos
SELECCIÓN DE CASOSDatos/Selección de Casos
Elaboración: S. Christian Orgaz Alonso, 2009
49
Selección de CasosEjercicio: (04_Cires 96…”)1) Crear una muestra de la matriz del 85% de los casos2) Pedir los estadísticos que correspondan para la variable “edad” y “sexo”3) Agrupar la edad en tres categorías 0 a 24/ 25 a 54/ 55 y más4) Asignar a las anteriores categorías los siguientes ingresos semanales medios. 1) 200€ 2) 400€ 3)300€ 5) Calcular a continuación una nueva variable con los ingresos mensuales de cada grupo. 6) ´¿Qué tipo de variable obtenemos y qué estadísticos podemos aplicar?
50
1) Con variable de ponderación previa. Datos/Ponderar Casos/ Variable de Ponderación2) Creación de una variable de ponderación (ver ejercicio).
PONDERACION
Elaboración: S. Christian Orgaz Alonso, 2009
51
Ponderación: Crear una tabla en SPSS a partir de datos agregados
En el periódico hemos encontrado la siguiente tabla ¿Cómo la pasamos a SPSS utilizando la ponderación?
A B CAsignamos a cada intersección, Creamos tres variables Creamos la Matriz
Un número (celda, paso C) en SPSS Celda V1 V2 V3
1.1. (200) 1.2 (30) V1 Salario (1,2,3) 1.1 1 1 200
2.1 (120) 2.2 (80) V2 Sexo (1,2) 1.2 1 2 30
3.1 (60) 3.2 (100) V3 Valores 1.3 2 1 …
DDatos/Ponderar Casos/Variable de Ponderación=V3
Ejercicio 4,3
Elaboración: S. Christian Orgaz Alonso, 2009
Ingresos Hombre (1)
Mujer (2)
Altos (1) 200 30
Medios (2) 120 80
Bajos (3) 60 100
52
Pasos :a) ¿Qué variables, cómo se distribuyen, qué nos interesa? (Exploratorio) b) Selección, recodificación y/o creación de nuevas variables (crear indicador) Analizar/Respuestas múltiples:
1) Definir conjunto y categorías2) Solicitar Frecuencias
FRECUENCIAS a partir de Múltiple Respuesta
Elaboración: S. Christian Orgaz Alonso, 2009
53
Creación de un Indicador (Múltiple respuesta):
A partir de la influencia de diversos medios de comunicación (TV pública, TV privada, online …) crear el indicador “influencia de los medios”:1º Definir qué categoría/s son las más relevantes.2º Crear una variable que agrupe las categorías más relevantes de las diversas variables.3º Creación de una tabla de continencia del indicador por la variable Sexo.
03_Archivo: Influencia de los medios
54
Fuentes : IMPORTACIÓN 1) Excel 2) MICRODATOS
a) ASCII (Archivo Texto) b) Sintaxis (Archivo de SPSS) [Dos formas] c) “otros programas”…
3) Fundir archivos.4) “¿¿¿Podemos cortar y pegar???”
Importar matrices de datosExiste un documento que desarrolla todo el apartado de
importación de datos, véase: “Apuntes para la
importación de datos en SPSS”
Elaboración: S. Christian Orgaz Alonso, 2009
55
1) Preparar los datos en formato de matriz2) Importar: Archivo/Abrir/*.xls3) Añadir etiquetas de variable y etiquetas de valores, casos
perdidos (si procede).
Importar matrices de datos (I)
EXCEL (.xls)
Elaboración: S. Christian Orgaz Alonso, 2009
56
Importar archivos Excel
Ejercicio 1: Descargar desde el INE una base de datos: Ine/Sociedad/Educación/Estadística de enseñanza universitaria
1) Antes de descargar asegurarse que tiene formato matriz (filas/casos y columnas/variables)
2) Desde excel modificar la matriz y dejarla limpia/neutra.3) Importar desde SPSS4) Introducir todos los datos que falten, etiquetas de valor si procede…
57
Importar archivos Excel
Ejercicio 2: “04_datos de asistentes”1) Limpieza de la matriz.2) Trasformaciones 3) Importar4) Etiquetas de variables, valores perdidos
58
1) Descargar los datos (*.txt) y Cuestionario/Libro de códigos2) ¿Cada caso cuántas filas?3) Leer datos/ ASCII/Procedemos dividir el ASCII en variables 4) Añadimos nombres de variables, etiquetas, valores …
Importar microdatos (II)
ASCII (*.txt) http://www.cis.es
Elaboración: S. Christian Orgaz Alonso, 2009
59
Microdatos desde ASCII
Ejercicio 3: “04_CIS_2008_codigo2781.pdf” y 04_CIS_2008_DA2781
1) Descargar los microdatos y Cuestionario/Libro de códigos2) ¿Cada caso cuántas filas?3) En SPSS: Archivo/Leer datos/ ASCII/Procedemos a dividir el
ASCII en variables 4) Añadimos nombres de variables, etiquetas, valores
60
1) Abrir el archivo que contiene los microdatos estructura ASCII2) Abrir la sintaxis que ejecuta la matriz. Empieza por
DATA LIST FILE= ‘Nombreficheroquecontienelosdatos'3) En la sintaxis “Ejecutar todo”
Importar microdatos (III)Sintaxis_A
“Automático” (CIS) “Data list file”
Elaboración: S. Christian Orgaz Alonso, 2009
61
Microdatos desde ASCII+Sintaxis
Ejercicio 4: 04_CIS_2008_DA2781 y 04_CIS_ES2781
1) Descargar los datos (*.txt) y Cuestionario/Libro de códigos2) ¿Cada caso cuántas filas?3) Leer datos/ ASCII/Procedemos a dividir el ASCII en variables 4) Añadimos nombres de variables, etiquetas, valores
62
1) Situar el archivo ASCII en una ruta accesible y copiamos la ruta (por ejemplo, GET DATA /TYPE = TXT
/FILE = 'C:\'datos_ENI07'2) Abrir la sintaxis y asegurarse que el tipo de archivo está bien y
pegar la ruta de acceso al archivo de microdatos. 3) En la sintaxis “Ejecutar todo”
Importar microdatos (III)Sintaxis_B
“Con ruta de acceso”: Get Data
Elaboración: S. Christian Orgaz Alonso, 2009
63
Microdatos desde ASCII+ Sintaxis
Ejercicio 5: 05_ENI_microdatos, 05_ENI Sintaxis y 05_Cuestionario
1) Descargar los datos (*.txt) y Cuestionario/Libro de códigos2) ¿Cada caso cuántas filas?3) Leer datos/ ASCII/Procedemos a dividir el ASCII en variables 4) Añadimos nombres de variables, etiquetas, valores
64
UNIDAD 4TABLAS DE CONTINGENCIA
Tablas de contingencia, porcentajes y lecturas. Creación de una tabla de contingencia a partir de valores absolutos dados. Pruebas de Chi2, fuerza y dirección . Interpretación de los resultados.
Elaboración: S. Christian Orgaz Alonso, 2009
65
1) Relación de las variables en la tabla2) Porcentajes y bases: TF/TC/TT. 3) Lecturas: Zeisel (% en sobre TC y lectura en el sentido de las
filas).4) Dependencia e independencia Estadística
TABLA DE CONTINGENCIA
Analizar/ Estadísticos Descriptivos/Tabla de Contingencia:
Elaboración: S. Christian Orgaz Alonso, 2009