ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… ·...

28
ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18

Transcript of ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… ·...

Page 1: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

ACTIVIDAD PRÁCTICA IV:

ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18

Page 2: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:
Page 3: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Actividad Práctica IV Análisis exploratorio con PASW Statistics 18

1

Universidad Miguel Hernández de Elche

Índice

1.- Introducción. 2.- Objetivos. 3.- Contenidos. 4.- Fundir archivos. 5.- Análisis exploratorio: el procedimiento explorar. 6.- Actividades. 7.- Lecturas complementarias: calcular y recodificar variables. 8.- Referencias.

Page 4: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Análisis Multivariado en CC. Del comportamiento Licenciado en Psicología

Universidad Miguel Hernández de Elche

2

ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18

11.. IINNTTRROODDUUCCCCIIÓÓNN:: En la anterior práctica aprendimos a gestionar y preparar una base de datos utilizando el programa

PASW Statistic-18. Para ello, cada equipo construyó dos bases de datos tipo PASW Statistic, se crea-

ron las variables y se introdujeron los valores.

En esta práctica, y con objeto de finalizar la preparación de la matriz de datos, fundiremos las dos

bases elaboradas anteriormente. De igual modo, en los casos necesarios recodificaremos las pre-

guntas inversas, transformaremos las variables y se tratarán las omisiones.

La práctica consistirá en la depuración de la matriz de datos así como en la realización

de un análisis exploratorio de la misma.

22.. OOBBJJEETTIIVVOOSS::

Mediante esta práctica el alumno aprenderá a realizar la depuración de la base de datos, así como

un análisis exploratorio de la misma empleando el programa PASW Statistic-18.

Los objetivos específicos de la práctica consisten en aprender a:

Combinar en un solo archivo los datos de archivos diferentes.

Crear nuevas variables mediante la transformación y/o combinación de otras existentes en

el archivo.

Analizar preliminarmente los datos realizando un análisis exploratorio.

Construir e interpretar representaciones gráficas tales como el diagrama de tallo y hojas y

el diagrama de cajas.

Page 5: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Actividad Práctica IV Análisis exploratorio con PASW Statistics 18

3

Universidad Miguel Hernández de Elche

33.. CCOONNTTEENNIIDDOOSS::

En ocasiones, antes de realizar la inspección de los datos, y realizar cualquier tipo de análisis, es

necesario preparar cuidadosamente la matriz de datos. Con objeto de organizar adecuadamente el

archivo de datos, con el que trabajaremos a lo largo del curso, previamente fundiremos las dos

bases que se han elaborado. Además, añadiremos al archivo resultante otras variables que puedan

resultar interesantes para los posteriores análisis.n cualquier párrafo. Observe el nombre del estilo

en la lista Estilo de la barra de herramientas Formato.

44.. FFUUNNDDIIRR AARRCCHHIIVVOOSS::

El software PASW Statistic permite combinar en un solo archivo datos almacenados en archivos

diferentes, con objeto de incluirlos en el mismo análisis de datos. Para tal fin nos ofrece dos posibi-

lidades:

Añadir casos: mediante esta función se combinan archivos que contienen las mismas varia-

bles, pero casos diferentes.

Añadir variables: mediante esta función se combinan archivos que contienen los mismos

casos, pero variables diferentes.

11)) AAÑÑAADDIIRR CCAASSOOSS.. Para ilustrar el procedimiento Fundir archivos → añadir casos, vamos a proceder a combinar las

bases que elaboramos en la práctica anterior (Base prácticas 1.sav y Base prácticas 2.sav). Am-

bas bases contienen las mismas variables pero incluyen casos distintos.

Para añadir casos debe abrirse en el editor de datos uno de los archivos que se desea combinar (Base prácticas 1.sav), que pasa a denominarse conjunto de datos activo. Tras abrir el archivo de trabajo, debe seleccionarse el archivo que se va fundir con él (Base prácticas 2.sav). Para ello:

Elija en el menú Datos > Fundir archivos> Añadir casos, para acceder al cuadro de diá-

logo Añadir casos a Base prácticas 1….Leer archivos.

Desde este cuadro de diálogo es posible seleccionar el archivo de datos cuyos casos se desea

añadir (ver figura 1). A este segundo archivo se le denomina conjunto de datos externo.

Page 6: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Análisis Multivariado en CC. Del comportamiento Licenciado en Psicología

Universidad Miguel Hernández de Elche

4

Figura 1. Cuadro de dialogo Añadir casos.

Al archivo resultado de la fusión se le denomina conjunto de datos combinado. Para realizar la

fusión:

Seleccionar el archivo Base prácticas 2> pulsar el botón abrir.., para acceder al cuadro

de diálogo Añadir casos de Base prácticas 2 (ver figura 2).

Page 7: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Actividad Práctica IV Análisis exploratorio con PASW Statistics 18

5

Universidad Miguel Hernández de Elche

Figura 2. Cuadro de dialogo Añadir casos de….

Como vemos en la figura 2 en el título del cuadro de dialogo queda reflejado que el archivo de

datos externo es Base prácticas 2. De igual modo en la parte inferior izquierda este archivo

queda precedido por el signo +.

AA.. VV AARRII AABB LLEE SS DDEE SSEE MMPP AARREE JJAADDAASS..

Ofrece un listado de las variables que no serán incluidas en el archivo combinado ya que son:

Variables que se encuentran sólo en uno de los dos archivos (o se les ha asignado como en

nuestro ejemplo un nombre diferente).

Variables definidas con formato numérico en uno de los dos archivos y con formato de ca-

dena en el otro: las variables numéricas no pueden combinarse con las variables de cade-

na.

Variables con formato de cadena que poseen distinto ancho. El ancho definido para una

variable de cadena debe ser el mismo en ambos archivos.

En estos casos, las variables del conjunto de datos activo (de destino) aparecen acompañadas por

un asterisco (*). Las variables del conjunto de datos externo aparecen acompañadas de un signo

más (+).

Page 8: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Análisis Multivariado en CC. Del comportamiento Licenciado en Psicología

Universidad Miguel Hernández de Elche

6

Como se puede observar en la figura 2, la lista variables desemparejadas contiene dos variables: la

variable Ansiedad examen que proviene del conjunto de datos activo (*) y la variable Ansiedad que

procede del conjunto de datos externo (+), aunque ambas contienen la misma información.

BB .. PP AARR.. En el caso de que existan variables desemparejadas que contienen la misma información, lo

habitual es crear pares de variables que se fusionan y trasladan a la lista de variables del nuevo

conjunto de datos activo. Para ello:

Marcar ambas variables, lo que activa el botón par situado debajo del botón flecha, y pul-

sar el botón par (ver figura 2).

CC.. VV AARRII AABB LLEE SS DDEE LL NN UUEE VVOO AARR CCHHII VV OO DDEE DDAATTOOSS AACCTTIIVV OO..

Contiene las variables que se incluirán en el nuevo conjunto de datos combinado. Por defecto,

todas las variables que coinciden con el nombre y el tipo de datos (numérico o de cadena) se in-

cluyen en la lista.

El programa permite eliminar las variables de la lista que no se desee incluir en el conjunto de

datos combinado.

DD.. II NN DDII CCAARR EE LL OORR II GGEENN DDEELL CCAASSOO CCOOMMOO VVAARRII AABBLLEE SS..

Permite crear una variable dicotómica para indicar el conjunto de datos al que pertenecía cada

caso. Esta variable tiene un valor de 0 para los casos del conjunto de datos activo y un valor de

1 para los casos del archivo de datos externos.

Por defecto el nombre para esta variable es source01, pero es posible introducir cualquier nom-

bre válido en el cuadro destinado a tal efecto.

Guarde los nuevos datos, resultados de la fusión de ambas bases, en un archivo con el

nombre Base prácticas combinada.

Page 9: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Actividad Práctica IV Análisis exploratorio con PASW Statistics 18

7

Universidad Miguel Hernández de Elche

22)) AAÑÑAADDIIRR VVAARRIIAABBLLEESS..

Para ilustrar el procedimiento Fundir archivos → añadir variables, vamos a incorporar de la base

métodos de aprendizaje la variable asignaturas pendientes, cuya medida se ha tomado en la misma

muestra de sujetos para un estudio que comparaba la eficacia de un metodología de aprendizaje

basada en clases magistrales frente a una metodología de aprendizaje interactiva. De esta manera

ambas bases contienen los mismos casos, pero difieren en las variables.

En primer lugar, para combinar dos archivos de datos tipo PASW Statistics con los mismos casos

pero con distintas variables, es imprescindible que ambos archivos estén ordenados con el mismo

criterio. Para nuestro ejemplo vamos a ordenar ambas bases según la variable código. Abrir ambos

tipos de archivos y emplear la función Ordenar casos.

AA.. )) OORR DDEENN AARR CCAASSOOSS..

Esta opción permite cambiar el orden de los casos utilizando como criterio una o más variables.

Elija en el menú Datos > Ordenar caso, para acceder al cuadro de diálogo Ordenar ca-

sos que muestra la figura 3.

Ordenar por: ordena los casos del archivo utilizando como criterio la variable que se haya tras-

ladado a esta lista. Si se utiliza más de una variable ordena los casos en función de la secuencia

que sigan las variables seleccionadas.

Page 10: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Análisis Multivariado en CC. Del comportamiento Licenciado en Psicología

Universidad Miguel Hernández de Elche

8

Figura 3. Cuadro de dialogo Ordenar casos

Para añadir variables debe abrirse en el editor de datos uno de los archivos que se desea com-

binar (Base prácticas combinada.sav), que pasa a ser el conjunto de datos activo. Tras abrir el

conjunto de datos activo, debe seleccionarse el archivo que se va fundir con él (Base métodos

aprendizaje.sav). Para ello:

Elija en el menú datos > Fundir archivos> Añadir variables, para acceder al cuadro de diálo-

go Añadir variables a Base prácticas combinada….Leer archivos (idéntico al de la figura 1).

Page 11: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Actividad Práctica IV Análisis exploratorio con PASW Statistics 18

9

Universidad Miguel Hernández de Elche

Seleccionando el conjunto de datos base métodos de aprendizaje y pulsando el botón Abrir se

despliega el cuadro de diálogo Añadir variables de…., que muestra la figura 4.

BB ..)) VV AARRII AABB LLEE SS EEXXCCLLUUII DDAASS..

Ofrece un listado de las variables que inicialmente no van a constituir el conjunto de datos

combinado. En este listado, por defecto, figuran aquellas variables del conjunto de datos ex-

terno cuyo nombre coincide con el de alguna variable del conjunto de datos activo.

Para incluir los datos de alguna variable cuyo nombre está duplicado es necesario renombrar

esa variable, utilizando el botón Cambiar nombre, y añadirla a la lista Nuevo conjunto de datos

activo.

CC.. )) NN UUEE VV OO CCOONN JJUUNNTT OO DDEE DDAATT OOSS AACCTT IIVV OO..

Contiene un listado de todas las variables que pasarán a formar parte del conjunto de datos

combinado. Es decir, todas las variables del conjunto de datos activo y aquellas del conjunto de

datos externos cuyos nombres no estén duplicados.

Si se desea eliminar alguna variable del Nuevo conjunto de datos activo, seleccionarla y con la

flecha trasladarla a la vista variables excluidas.

Seleccionar las variables TipoAprendi y Satisfacción y trasladarlas a la vista Variables ex-

cluidas. (ver figura 4).

Page 12: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Análisis Multivariado en CC. Del comportamiento Licenciado en Psicología

Universidad Miguel Hernández de Elche

10

Figura 4. Cuadro de dialogo Añadir variables de….

DD.. VVAARRII AABBLLEE SS CCLLAAVVEE ..

Si algunos casos en un conjunto de datos no tiene concordancia con los casos del otro conjunto

de datos (es decir, en algunos casos no están presentes en ambos conjunto de datos), se pue-

den emplear algunas variables clave para identificar y emparejar correctamente los casos de los

dos conjuntos de datos.

Guarde los nuevos datos, resultados de la fusión de las variables AsigPendi en el archi-

vo Base prácticas combinada.

Page 13: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Actividad Práctica IV Análisis exploratorio con PASW Statistics 18

11

Universidad Miguel Hernández de Elche

55.. AANNÁÁLLIISSIISS EEXXPPLLOORRAATTOORRIIOO:: EELL PPRROOCCEEDDIIMMIIEENNTTOO EEXXPPLLOORRAARR..

Pese a que se haya sido extremadamente cuidadoso en la introducción de los datos en la ma-

triz, no se debe comenzar ningún procedimiento estadístico sin antes realizar una exploración

preliminar de los datos.

Realizar un análisis exploratorio previo es esencialmente ventajoso puesto que permite identi-

ficar:

Posibles errores (de registro y/o de codificación).

Valores extremos y ausentes.

Pautas extrañas en los datos (valores que continuamente se repiten o no aparecen).

Variabilidad no esperada (demasiada concentración en torno a un valor, o en una de

las dos colas de la distribución), etc.

El procedimiento Explorar permite detectar este tipo de problemas bien para el conjunto de da-

tos o por separado para grupos de casos.

A continuación vamos a realizar el análisis exploratorio de la variable edad. Para obtener el

cuadro de diálogo Explorar:

Seleccionar Analizar> Estadísticos descriptivos> Explorar (ver figura 5).

Page 14: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Análisis Multivariado en CC. Del comportamiento Licenciado en Psicología

Universidad Miguel Hernández de Elche

12

Figura 5. Cuadro de dialogo Explorar.

AA.. )) DDEE PPEE NN DDII EENNTT EE SS..

Al trasladar a esta lista una o más variables y pulsar el botón Aceptar se obtienen los es-

tadísticos y gráficos.

BB ..)) FFAACCTT OORREE SS..

Si se está interesado en analizar por separado distintos grupos de casos (por ejemplo hom-

bres y mujeres), en lugar de analizar todo el conjunto de datos, debe introducirse la varia-

ble que define esos valores (en nuestro ejemplo sería la variable sexo).

CC.. )) EE TTII QQ UUEETT AARR LLOOSS CCAASSOOSS MMEE DDII AANNTT EE..

Page 15: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Actividad Práctica IV Análisis exploratorio con PASW Statistics 18

13

Universidad Miguel Hernández de Elche

El procedimiento por defecto en algunos gráficos y tablas identifica los casos individuales

empleando el número de registro (fila) que ocupan en el Editor de datos. No obstante, el

programa permite identificar los casos a través de los valores de alguna variable concreta.

Para ello es necesario trasladar esa variable al cuadro de diálogo Etiquetar los casos me-

diante.

11)) EEXXPPLLOORRAARR.. EESSTTAADDÍÍSSTTIICCOOSS..

Para que este botón esté activo es necesario que en la opción Mostrar (ver figura 5) esté marca-

da la opción Estadísticos o Ambos.

Esta opción por defecto ofrece los siguientes estadísticos descriptivos: media aritmética, media-

na, media truncada o recortada al 5%, el intervalo de confianza para la media, el error típico de

la media, la varianza, desviación típica, los valores máximo y mínimo, la amplitud, la amplitud

intercuartílica, los índices de asimetría y curtosis y sus respectivos errores típicos.

Al margen de la opción activada por defecto permite obtener algunos estadísticos adicionales,

tales como; Estimadores robustos centrales (estimadores de tendencia central basados en el

método de máxima verosimilitud), Valores atípicos y Percentiles (5, 10, 25, 50, 75, 90 y 95).

A continuación vamos a realizar el análisis exploratorio de la variable edad, solicitándole al pro-

grama la opción Valores atípicos. Para ello:

Pulsar el botón Estadísticos.., del cuadro de diálogo principal para acceder al subcua-

dro de diálogo Estadísticos (ver figura 5) y seleccionar Valores atípicos.

Figura 6. Subcuadro de dialogo Explorar: Estadísticos

Page 16: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Análisis Multivariado en CC. Del comportamiento Licenciado en Psicología

Universidad Miguel Hernández de Elche

14

Aceptando esta elección el Visor de Resultados nos ofrece los resultados que se muestran en las

tablas 1 y 2.

Tabla 1. Resumen del procesamiento de casos

Casos

Válidos Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

Edad 104 00,0% 0 ,0% 104 100,0%

Como se puede observar en la tabla de Resumen del procesamiento de casos (tabla 1) no exis-

ten valores perdidos, siendo el total de la muestra igual a 104 sujetos.

Tabla 2.Valores extremos

Edad Número del caso Valor

Mayores 1

2

3

4

5

41

62

64

73

1

43,00

30,00

30,00

27,00

26,00a

Menores 1

2

3

4

5

103

99

98

95

91

18,00

18,00

18,00

18,00

18,00b

Page 17: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Actividad Práctica IV Análisis exploratorio con PASW Statistics 18

15

Universidad Miguel Hernández de Elche

a. En la tabla de valores extremos mayores sólo se muestra una lista parcial de los casos con el

valor 26.

b. En la tabla de valores extremos menores sólo se muestra una lista parcial de los casos con el

valor 18.

La tabla de Valores extremos (tabla 2) ofrece un listado de los cinco casos con los valores más pe-

queños y los cinco casos con los valores más altos.

De esta manera, como se puede observar en la tabla 2 en la parte alta de la distribución existe un

sujeto que presenta una edad de 43 años, dos sujetos con 30 años, otro sujeto con 27 y más de

cinco sujetos que presentan una edad de 26 años.

Mientras en la parte baja de la distribución se observa que existen más de cinco sujetos que pre-

sentan una edad de 18 años.

* Estos valores extremos no deben confundirse con los valores extremos o atípicos que veremos

mediante los diagramas de caja. Aunque a los valores que acabamos de ver también se les llama

extremos, se trata simplemente de los valores más grandes y más pequeños de la distribución.

22)) EEXXPPLLOORRAARR.. GGRRÁÁFFIICCOOSS..

El botón Gráficos estará activo si en la opción Mostrar del cuadro Explorar está marcada la opción

Gráficos o Ambos (ver figura 5).

Esta opción permite obtener diagramas de caja, diagramas de tallo y hojas, histogramas y gráficos

para comprobar los supuestos de normalidad y homogeneidad de varianzas.

Con objeto de continuar con el análisis exploratorio de la variable edad empleando representacio-

nes gráficas, vamos a solicitar al programa los diagramas de caja y los diagramas de tallo y hoja.

AA.. )) DDII AAGGRRAAMMAASS DDEE CCAAJJAA..

Proporciona información sobre el grado de dispersión de los datos y el grado de la asimetría de

la distribución. Ofrece la mediana, percentiles 25 y 75, valores extremos y atípicos.

Se puede seleccionar si se desea un gráfico diferente para cada variable dependiente (niveles de

los factores juntos) o un solo gráfico para varias variables dependientes (dependientes juntas).

Page 18: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Análisis Multivariado en CC. Del comportamiento Licenciado en Psicología

Universidad Miguel Hernández de Elche

16

Niveles de los factores juntos: Muestra de forma conjunta los diagramas correspondientes

a cada grupo en el que se puede dividir la muestra en función de una variable factor. Está

opción resulta muy útil cuando se pretende comparar distintos grupos en una misma varia-

ble.

BB ..)) DDII AAGGRRAAMMAASS DDEE TTAALLLLOO YY HH OOJJAASS..

En este diagrama cada valor se compone de dos partes: el primer dígito (el tallo o stem) y el se-

gundo dígito (hojas o leaf). Por ejemplo, el valor 23 puede descomponerse en un tallo de 2 y una

hoja de 3. La longitud de las líneas refleja el número de casos que pertenece a cada intervalo.

Cada tallo puede ocupar una o más filas.

En la parte inferior viene indicada la anchura del tallo (ítem width) y el número de dígitos que

representa cada hoja (each leaf). Cuando la anchura del tallo vale 10, los dígitos de las hojas son

unidades. Cuando la anchura del tallo vale 100, los dígitos son decenas (each leaf = 2). Cuando

vale 1000 son centenas (each leaf = 3), etc. La última fila muestra los casos extremos atípicos.

Para continuar con el ejercicio:

Pulsar el botón Gráficos.., del cuadro de diálogo principal para acceder al subcuadro de

diálogo Explorar. Graficos (ver figura 5) y seleccionar Diagramas de Caja → Niveles de fac-

tores juntos, y Descriptivos → Tallo y hojas.

Page 19: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Actividad Práctica IV Análisis exploratorio con PASW Statistics 18

17

Universidad Miguel Hernández de Elche

Figura 7. Subcuadro de dialogo Explorar: Gráficos

Aceptando estas elecciones el Visor de Resultados nos ofrece las gráficas que se muestran a conti-

nuación (Figuras 8 y 9).

Page 20: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Análisis Multivariado en CC. Del comportamiento Licenciado en Psicología

Universidad Miguel Hernández de Elche

18

Figura 8. Detalles de un diagrama de cajas

Como puede observarse en la Figura 8, el diagrama de caja nos muestra que el 50% de los casos

centrales estarían entre los valores 18 (percentil 25) y 21 (percentil 75). La mediana es 19 y vemos

que está desplazada hacia la parte inferior de la caja.

La caja (cuya altura representa la amplitud intercuartílica: distancia entre el primer y tercer cuartil)

muestra el grado de dispersión del 50% de los casos centrales.

Page 21: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Actividad Práctica IV Análisis exploratorio con PASW Statistics 18

19

Universidad Miguel Hernández de Elche

Figura 9. Detalles de un diagrama de Tallo y hojas

Edad Stem-and-Leaf Plot Frequency Stem & Leaf 50,00 18 . 0000000000000000000000000000000000000000000000000 ,00 18 . 18,00 19 . 000000000000000000 ,00 19 . 9,00 20 . 000000000 ,00 20 . 9,00 21 . 000000000 ,00 21 . 9,00 22 . 000000000 ,00 22 . 2,00 23 . 00 ,00 23 . 1,00 24 . 0 6,00 Extremes (>=26,0) Stem width: 1,00 Each leaf: 1 case(s)

Por otro lado, en el diagrama de tallo y hojas (Figura 9) podemos observar que en el tallo aparecen

los valores que adopta la variable edad, en las hojas no hay datos ya que se trata de unidades. En el

diagrama los tallos representan una fila. La anchura del tallo viene indicada por en la parte inferior

del tallo (Stem width= 1), lo que significa que los valores del tallo hay que multiplicarlos por uno.

Tal y como muestra la figura 9 existen 50 sujetos que tienen una edad de 18 años, 18 sujetos que

presentan una edad de 19 años, 9 sujetos con 20, 9 con 21 años, 9 sujetos con 22, 2 sujetos que

presentan una edad de 23 años y un sujeto con una edad de 24.

La última fila del diagrama muestra el número de casos con valores extremos y los valores que

toman estos casos (entre paréntesis). De esta manera, en el diagrama de tallo y hojas aparecen 6

casos extremos que presentan una edad mayor a 26 años (obsérvese que este dato está en corres-

pondencia con la información ofrecida por el diagrama de cajas).

Page 22: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Análisis Multivariado en CC. Del comportamiento Licenciado en Psicología

Universidad Miguel Hernández de Elche

20

66.. AACCTTIIVVIIDDAADDEESS::

Ordene los datos del archivo Base prácticas combinada en función de la variable Edad.

Guarde el nuevo conjunto de datos en un archivo denominado Base prácticas edad.

A partir de los datos incluidos en los archivos Base prácticas edad y Base métodos de

aprendizaje añada la variable Satisfacción (grado de satisfacción con la metodología recibi-

da) y guarde el nuevo conjunto de datos en un archivo denominado Base prácticas Satis-

facción.[Sugerencia: Recuerde que el archivo Base prácticas edad está ordenado según la

variable edad].

A partir del archivo Base prácticas combinada, obtenga e interprete la tabla de valores ex-

tremos para la variable Asignaturas pendientes (AsigPendi).

A partir del archivo Base prácticas combinada, construya e interprete un diagrama de Tallo

y hojas para la variable Preocupación.

A partir del archivo Base prácticas combinada, construya e interprete un diagrama de barras para la

variable Miedo al desprestigio social (Miedo_desprestigio).

Siguiendo con el archivo Base prácticas combinada, comparé mediante un diagrama de ba-

rras la distribución de la variable Ansiedad ante los exámenes (Ansiedad_examen) de am-

bos sexos (variable Sexo). [Sugerencia: Recuerde que el software Pasw Statistics 18 nos

ofrece la posibilidad de organizar los diagramas mostrando en un mismo gráfico los dia-

gramas correspondientes a distintos grupos definidos por un factor].

77.. LLEECCTTUURRAASS CCOOMMPPLLEEMMEENNTTAARRIIAASS:: CCAALLCCUULLAARR YY RREECCOODDII FFIICCAARR VVAARRIIAABBLLEESS::

AA.. )) CCÁÁLLCCUULLOO DDEE VV AARR II AABB LLEE SS

Utilice el cuadro de diálogo Calcular para calcular los valores de una variable basándose en trans-

formaciones numéricas de otras variables.

Puede calcular valores para las variables numéricas o de cadena (alfanuméricas).

Puede crear nuevas variables o bien reemplazar los valores de las variables existentes. Para

las nuevas variables, también se puede especificar el tipo y la etiqueta de variable.

Puede calcular valores de forma selectiva para subconjuntos de datos basándose en condi-

ciones lógicas.

Page 23: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Actividad Práctica IV Análisis exploratorio con PASW Statistics 18

21

Universidad Miguel Hernández de Elche

Elija en el menú Transformar la opción→ Calcular.

Escriba el nombre de una sola variable de destino. Puede ser una variable existente o una nueva

que se vaya a añadir al archivo de datos de trabajo.

Para crear una expresión, puede pegar los componentes en el campo Expresión o escribir directa-

mente en dicho campo.

Puede pegar las funciones o las variables de sistema utilizadas habitualmente seleccionan-

do un grupo de la lista Grupo de funciones y pulsando dos veces en la función o variable

de las listas de funciones y variables especiales (o seleccione la función o variable y pulse

en la flecha que se encuentra sobre la lista Grupo de funciones). Rellene los parámetros

indicados mediante interrogaciones (aplicable sólo a las funciones). El grupo de fun-

ciones con la etiqueta. Todo contiene una lista de todas las funciones y variables de siste-

ma disponibles. En un área reservada del cuadro de diálogo se muestra una breve descrip-

ción de la función o variable actualmente seleccionada.

Si los valores contienen decimales, debe utilizarse un punto (.) como indicador decimal.

Para las nuevas variables de cadena, también deberán seleccionar Tipo y etiqueta para es-

pecificar el tipo de datos.

BB ..)) RR EE CCOODDII FFII CCAARR EENN DDII SSTTII NNTT AASS VV AARR IIAABB LLEE SS

El cuadro de diálogo Recodificar en distintas variables le permite reasignar los valores de las varia-

bles existentes o agrupar rangos de valores existentes en nuevos valores para una variable nueva.

Por ejemplo, podría agrupar los salarios en una nueva variable que contenga categorías de rangos

de salarios.

Puede recodificar las variables numéricas y de cadena.

Puede recodificar variables numéricas en variables de cadena y viceversa.

Si selecciona múltiples variables, todas deben ser del mismo tipo. No se pueden recodificar

juntas las variables numéricas y de cadena.

Elija en el menú Transformar la opción→ Recodificar…..En distintas variables.

Seleccione las variables que desee recodificar. Introduzca el nombre de la nueva variable

de resultado para cada nueva variable y pulse en Cambiar.

Page 24: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Análisis Multivariado en CC. Del comportamiento Licenciado en Psicología

Universidad Miguel Hernández de Elche

22

Pulse en Valores antiguos y nuevos y especifique cómo deben recodificarse los

valores→ Pulse en Añadir para colocar la especificación en la lista Antiguo–>Nuevo.

CC.. )) RREE CCOODDII FFII CCAARR EE NN DDII SSTT IINN TTAASS VVAARRII AABBLLEE SS:: VV AALLOORR EE SS AANN TTII GGUUOOSS YY NN UUEEVV OOSS

Este cuadro de diálogo permite definir los valores que se van a recodificar.

Valores antiguos y nuevos: Determina el valor o los valores que se van a recodificar. Puede recodifi-

car valores individuales, rangos de valores y valores perdidos. Los rangos y los valores perdidos del

sistema no se pueden seleccionar para las variables de cadena, ya que ninguno de los conceptos es

aplicable a estas variables. Los valores antiguos deben ser del mismo tipo de datos (numéricos o de

cadena) que la variable original. Los rangos incluyen sus puntos finales y los valores definidos como

perdidos por el usuario que estén dentro del rango.

Valor (Recodificar). Valor antiguo individual que se a recodificar en un valor nuevo. El tipo

de datos (numérico o de cadena) del valor introducido debe coincidir con el tipo de datos

de las variables desee recodificar.

Perdido por el sistema. Valores asignados por SPSS cuando los valores de sus datos no

están definidos de acuerdo al tipo de formato que haya especificado, cuando un campo

numérico está vacío, o cuando no está definido un valor como resultado de un comando de

transformación. Los valores numéricos perdidos del sistema se muestran como puntos.

Perdido por el sistema o por el usuario. Observaciones que tienen valores que, o bien han

sido declarados perdidos por el usuario o bien son desconocidos y han sido asignados el

valor perdido por el sistema, lo cual se indica mediante un punto (.).

Rango (Rango inclusivo de valores). Un rango inclusivo de valores. Se incluirán cualesquiera

valores definidos por el usuario como perdidos que se encuentren dentro del rango.

Todos los demás valores. Cualquier valor no incluido en una de las especificaciones de la

lista Antiguo->Nuevo. Aparece en la lista Antiguo- >Nuevo como ELSE (otros).

Valor nuevo. Es el valor individual en el que se recodifica cada valor o rango de valores an-

tiguo. Los valores nuevos pueden ser numéricos o de cadena.

Valor. Valor en el que se va a recodificar uno o más valores antiguos.

Perdido por el sistema. Recodifica el valor antiguo especificado como valor perdido por el

sistema. El valor perdido por el sistema no se utiliza en los cálculos. Además, los casos con

valor perdido por el sistema se excluyen de muchos procedimientos. No se encuentra dis-

ponible para las variables de cadena.

Copiar los valores antiguos. Retiene el valor antiguo. Si algunos de los valores no requieren

la recodificación, utilice esta opción para incluir los valores antiguos. Cualquier valor anti-

Page 25: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Actividad Práctica IV Análisis exploratorio con PASW Statistics 18

23

Universidad Miguel Hernández de Elche

guo que no sea especificado no se incluye en la nueva variable, y los casos con esos valores

se asignan al valor perdido por el sistema en la nueva variable.

Las variables de los resultados son cadenas. Define la nueva variable recodificada como va-

riable de cadena (alfanumérica). La variable antigua puede ser numérica o de cadena.

Convertir cadenas numéricas en números. Convierte los valores de cadena que contienen

números en valores numéricos. A las cadenas que contengan cualquier cosa que no sean

números y un carácter de signo opcional (+ ó -) se les asignará el valor perdido por el sis-

tema.

Antiguo–>Nuevo. Contiene la lista de especificaciones que se va a utilizar para recodificar

la variable o las variables. Puede añadir, cambiar y borrar las especificaciones que desee.

La lista se ordena automáticamente basándose en la especificación del valor antiguo y si-

guiendo este orden: valores únicos, valores perdidos, rangos y todos los demás valores. Si

cambia una especificación de recodificación en la lista, el procedimiento volverá a ordenar

la lista automáticamente, si fuera necesario, para mantener este orden.

EE .. RR EE CCOODDII FFII CCAARR EENN LLAASS MMII SSMMAASS VV AARR II AABB LLEE SS

El cuadro de diálogo Recodificar en las mismas variables le permite reasignar los valores de las

variables existentes o agrupar rangos de valores existentes en nuevos valores. Por ejemplo, podría

agrupar los salarios en categorías que sean rangos de salarios.

Puede recodificar las variables numéricas y de cadena. Si selecciona múltiples variables, todas de-

ben ser del mismo tipo. No se pueden recodificar juntas las variables numéricas y de cadena.

Elija en el menú Transformar la opción→ Recodifi car…..En las mismas variables. Selec-

cione las variables que desee recodificar. Si selecciona múltiples variables, todas deberán

ser del mismo tipo (numéricas o de cadena).

(Pulse en Valores antiguos y nuevos y especifique cómo deben recodificarse los valo-

res→ Pulse en Añadir para colocar la especificación en la lista Antiguo–>Nuevo.

El nuevo valor deberá ser del mismo tipo (numérico o de cadena) que la variable existente. Si se

trata de variables de cadena, deberá tener la misma longitud que la variable existente.

Page 26: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Análisis Multivariado en CC. Del comportamiento Licenciado en Psicología

Universidad Miguel Hernández de Elche

24

88.. RREEFFEERREENNCCIIAASS

Amón, J. (1979). Estadística para psicólogos, vol. 1 (2ª ed.). Madrid: Pirámide.

Amón, J. (1984). Estadística para psicólogos, vol. 2 (3ª ed.). Madrid: Pirámide.

Botella, J., León, O. G. y San Martín, R. (1993). Análisis de datos en psicología I. Madrid: Pirámide.

Meliá, J. L. (1990). Introducción a la medición y análisis de datos. Valencia: Cristóbal Serrano.

Pardo, A. y San Martín, R. (1999). Análisis de datos en psicología II. Madrid: Pirámide.

Pardo, A. y Ruiz, M.G. (2005). SPSS-13. Guía para el Análisis de datos. Madrid: McGraw-Hill D.L.

Rial, A., Varela, J. y Rojas, A. (2001). Depuración y análisis preliminares de datos en SPSS. Madrid:

Rama.

San Martín, R. y Pardo, A. (1990) Psicoestadística. Contrastes paramétricos y no paramétricos. Ma-

drid: Pirámide.

Page 27: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Actividad Práctica IV Análisis exploratorio con PASW Statistics 18

25

Universidad Miguel Hernández de Elche

Page 28: ACTIVIDAD PRÁCTICA IVrepositorio.innovacionumh.es/Proyectos/P_22CursoMateriales/Monic… · ACTIVIDAD PRÁCTICA IV: ANÁLISIS EXPLORATORIO CON PASW STATISTICS 18 1. INTRODUCCIÓN:

Análisis Multivariado en CC. Del comportamiento Licenciado en Psicología

Universidad Miguel Hernández de Elche

26