Post on 25-Feb-2018
7/25/2019 04 Sesin 4 (2)
1/25
ESTADSTICAS ISesin 4
30 de agosto de 2015
Prof. Gabriel Oterogabriel.otero@mail.udp.cl
Escuela de Sociologa
7/25/2019 04 Sesin 4 (2)
2/25
Sesin anterior
1) Proceso de Operacionalizacin
a) Conceptos
b) Dimensiones
c) Indicadoresd) Atributos
2) La medicin de una variable
a) Exhaustividadb) Exclusividad
c) Precisin
7/25/2019 04 Sesin 4 (2)
3/25
CONSTRUCCIN DE DATOSCmo trabajamos con datos?
7/25/2019 04 Sesin 4 (2)
4/25
Sesin 4 Construccin de datos
1) La encuesta y recoleccin de datos
2) Matriz de datos
3) Codificacin4) Introduccin al SPSS
5) Datos perdidos
6) Preguntas de respuestas mltiples
7/25/2019 04 Sesin 4 (2)
5/25
Problema deInvestigacin
Objetivos deInvestigacin
Preguntas de
Investigacin
Marco Terico
Hiptesis
Identificacinde Variables
Medicin
Datos
Operacionalizacin
7/25/2019 04 Sesin 4 (2)
6/25
La encuesta y recoleccin de datos Los datos se pueden recopilar de mltiples formas, pero en las
ciencias sociales, generalmente, lo hacemos a travs deencuestas.
La encuesta es un instrumento de recoleccin de datos, que
se presenta en la forma de cuestionario estandarizado,estructurado, para obtener informacin de distinta ndole:caractersticas sociodemogrficas (sexo, edad, estado civil,etc.), actitudes frente a determinados fenmenos sociales(aborto, marihuana, lucro en la educacin, situacin econmica
del pas), confianza en las instituciones, redes sociales de laspersonas, entre otra.
Luego de tener los datos es necesario organizarlos
pero, cmo lo hacemos?
7/25/2019 04 Sesin 4 (2)
7/25
La encuesta y recoleccin de datos1) Las preguntas de las encuesta se traspasan a la base dedatos como variables.
Cada variable corresponde a una columna en la base de
datos. Una pregunta puede estar representada por ms de unavariable en la base de datos.
El proceso de traducir las preguntas de la encuesta envariables es un proceso complejo y delicado: la codificacin.
7/25/2019 04 Sesin 4 (2)
8/25
La encuesta y recoleccin de datos2) Las respuestas recogidas de las personas, gracias a unaencuesta, se traspasan a la base de datos como datos.
Cada persona corresponde a una fila en la base de datos.
Cada casilla representa la respuesta del individuo para esavariable en particular (dato).
7/25/2019 04 Sesin 4 (2)
9/25
Base o matriz de datos
Las matrices de datos nos permiten incorporar, ordenary clasificar la informacin que hemos recogido sobrenuestra unidad de anlisis (personas, hogares,instituciones, pases, etc.), a partir de las variablesempricas que definimos en la operacionalizacin.
Las matrices de datos presentan un conjunto de casillasen las cuales se introducen, numricamente, los datosrecopilados sobre las variables de inters.
Numricamente?... Entonces, qu ocurre con lasvariables cualitativas, que no se definen naturalmente entrminos numricos?
7/25/2019 04 Sesin 4 (2)
10/25
Codificacin Cuando tenemos los datos (informacin) codificar las
categoras (atributos) de las variables como valoresnumricos para poder procesarlas con facilidad en programasestadsticos.
Es conveniente asignar etiquetas a los valores de lasvariables para recordar qu significan los cdigosnumricos.
Generalmente los valores de las variables van de 1 hastala cantidad de categoras que tenga la variable.
Categoras de lavariable sexo
Valores/cdigos
Numricos de la variableEtiquetas de los valores
numricos de la variable
MUJER 1 MUJER
HOMBRE 2 HOMBRE
7/25/2019 04 Sesin 4 (2)
11/25
EJEMPLO 1: Codificacin de categoras
Categoras de la variable Valores/cdigos
Numricos de la variable
Etiquetas de los valores
numricos de la variableMUY DE ACUERDO 1 MUY DE ACUERDO
DE ACUERDO 2 DE ACUERDO
NI DE ACUERDO NI ENDESACUERDO
3NI DE ACUERDO NI ENDESACUERDO
EN DESACUERDO 4 EN DESACUERDOMUY EN DESACUERDO 5 MUY EN DESACUERDO
Cun de acuerdo o en desacuerdo est usted con el abortocuando est en peligro la vida de la madre?
Ser necesario codificar los valores de las variables
cuantitativas en nmeros?
7/25/2019 04 Sesin 4 (2)
12/25
Algunas consideraciones
Aunque se codifiquen como nmeros, debemosrecordar siempre el verdadero tipo de las variables y susignificado cuando vayamos a usar programas de clculoestadstico.
No todo est permitido con cualquier tipo de variable.A veces se pueden asignar cdigos numricos a
respuestas especiales como No sabe o No Responde.Estas situaciones debern ser tenidas en cuenta en el
anlisis en algunos casos podrn considerarse comodatos perdidos.
7/25/2019 04 Sesin 4 (2)
13/25
SPSSStatistical Package for the Social Sciences
7/25/2019 04 Sesin 4 (2)
14/25
Ventanas ms importantes
Vista de Variables
Vista de Datos
Editor de Sintaxis
Vista de Resultados
7/25/2019 04 Sesin 4 (2)
15/25
Vista de Variables
7/25/2019 04 Sesin 4 (2)
16/25
Vista de Datos
7/25/2019 04 Sesin 4 (2)
17/25
Editor de Sintaxis
7/25/2019 04 Sesin 4 (2)
18/25
Vista de Resultados
7/25/2019 04 Sesin 4 (2)
19/25
Datos perdidos
Son casillas, en la matriz de datos, que no contieneninformacin o cuya informacin no es clara:
Sin informacin (casilla en blanco)
No respuesta
No aplica
Respuesta inapropiada
Importa mucho saber qu proporcin (porcentaje)
representan respecto del total de datos. En general, no se grafican ni se incluyen en tablas. Sin
embargo, cuando representan ms del 5% o 10% sedebe dar cuenta de su existencia de formas va a
depender del investigador y el anlisis que haga.
7/25/2019 04 Sesin 4 (2)
20/25
Respuestas mltiples
Generalmente, las preguntas slo contemplan unaalternativa de respuesta posible.
Hay ocasiones donde tenemos preguntas de respuestasmltiples. Son preguntas donde se puede contestar msde una alternativa de respuesta, sin jerarquizarlas.
Cada respuesta representa una variable distinta en lamatriz de datos, de modo que el total de variables paraesta pregunta depender del caso que tenga un mayor
nmero respuestas.
Estas preguntas se analizan de forma distinta loveremos ms adelante.
7/25/2019 04 Sesin 4 (2)
21/25
EJEMPLO 2: Preguntas de respuestas mltiples
Categoras de
posibles respuestas
Valores/cdigos
Numricos de la variable
Etiquetas de los valores
numricos de las 3 VARIABLESDELINCUENCIA 1 DELINCUENCIA
SALUD 2 SALUD
EDUCACIN3
EDUCACIN
MEDIO AMBIENTE 4 MEDIO AMBIENTECORRUPCIN 3 CORRUPCIN
POBREZA 4 POBREZA
DESEMPLEO 5 DESEMPLEO
(p1) Por favor, mencione las 3 reas en las que, por suimportancia, debera enfocarse el gobierno de Michelle Bachelet.
Se crean tres variables de iguales caractersticas: p1_1, p1_2, p1_3
7/25/2019 04 Sesin 4 (2)
22/25
Para terminar preguntas vs. variables
No olvidar que una pregunta, no siempre equivale a unasola variable.
Para saber cuntas variables presenta el cuestionario deuna encuesta, debemos pensar en cuntas respuestasposibles tiene.
Entonces, cada respuesta posible del cuestionario tieneque verse reflejada en una variable.
7/25/2019 04 Sesin 4 (2)
23/25
EJEMPLO 3: Preguntas vs. Variables
Etiqueta corta Variables (oficios) SI NO
P2_1 Obrero de la construccin 1 2P2_2 Cocinero 1 2
P2_3 Chofer de taxi o colectivo 1 2
P2_4 Profesor de colegio 1 2
P2_5 Contador 1 2
P2_6 Arquitecto 1 2
P2_7 Mdico 1 2
P2_8 Abogado 1 2
(p2) Por favor, indqueme si conoce o no personas que tengan lossiguientes oficios
VARIABLES: tenemos 8 variables a partir de una pregunta general.
7/25/2019 04 Sesin 4 (2)
24/25
Entonces
1) La encuesta y recoleccin de datos
2) Matriz de datos
3) Codificacin4) Introduccin al SPSS
5) Datos perdidos
6) Preguntas de respuestas mltiples
7/25/2019 04 Sesin 4 (2)
25/25
BIBLIOGRAFA Agresti, A., & Franklin, C. A. (2007). Stat ist ics : the art and s cienceof learn ing from data. Captulo N1
Bryman, A., & Cramer, D. (2005). Quanti tative Data Analysis w ithSPSS Release 12 and 13. Captulo N2.
Field, A. P. (2009). Disco vering st at ist ics using SPSS. CaptuloN3.
Pardo Merino, A., & Ruiz, M. . (2002). SPSS 11: gua para elanlis is de dato s. Madrid: McGraw-Hill, Interamericana de Espaa.
Prez Lpez, C. (2005). Tcnic as es tadsti cas con SPSS 12:
aplic acio nes al anlis is de d atos. Madrid [etc]: Pearson. Ritchey, F. (2008). Estadstic a para las Cienc ias So c iales. Mxico:
McGrawll Hill.