Estadística Básica Aplicada Con SPSS

42
ESTADÍSTICA BÁSICA APLICADA CON SPSS Alfonso García Pérez María Yolanda Cabrero Ortega

description

estadistica

Transcript of Estadística Básica Aplicada Con SPSS

  • ESTADSTICA BSICA APLICADA

    CON SPSS

    Alfonso Garca Prez Mara Yolanda Cabrero Ortega

  • ESTADSTICA BSICA APLICADA CON SPPS 2

    Copyright 2010 Alfonso Garca Prez Mara Yolanda Cabrero Ortega ``No est permitida la reproduccin total o parcial de este libro, ni su tratamiento informtico, ni la transmisin de ninguna forma o por cualquier medio, ya sea electrnico, mecnico, por fotocopia, por registro u otros medios, sin el permiso previo y por escrito de los titulares del Copyright. El contenido de este libro est registrado por el autor en el Registro de la Propiedad Intelectual y protegido por la Ley, que establece penas de prisin adems de las correspondientes indemnizaciones para quien lo plagiara"

    Edita: Universidad Nacional de Educacin a Distancia

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 3

    Contenido

    Prlogo. 5 Captulo 1: Introduccin al SPSS 7 Captulo 2: Estadstica Descriptiva . 11 Captulo 3: Intervalos y Contrastes bsicos . 17 Captulo 4: Anlisis de la Varianza ............. 19 Captulo 5: Regresin Lineal y Correlacin .. 31 Captulo 6: Tablas de Contingencia ............... 37

  • ESTADSTICA BSICA APLICADA CON SPPS 4

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 5

    Prlogo

    El presente texto es dedicado al Tratamiento Informtico del curso Estadstica Aplicada a las Ciencias de la Salud. En l se analiza el uso de SPSS. No obstante, ya adelantamos que no es exhaustivo en cuanto al anlisis de todos los Mtodos a los que dicho paquete se puede aplicar, ya que la mejor manera de aprenderlo es utilizarlo y, en la mayora de las ocasiones, los comentarios resultan redundantes ante la sencillez de manejo de este software. Dado que los ejemplos que analizaremos en este texto son los del libro Estadstica Aplicada: Conceptos Bsicos, no repetiremos aqu los enunciados de dichos ejemplos, indicndolos con la abreviatura CB y el nmero del ejemplo correspondiente. Por ltimo, le recordamos que puede ver ms grandes la reproducciones de la pantalla, es decir, las ventanas, utilizando el zoom de su pdf.

    Alfonso Garca Prez Mara Yolanda Cabrero Ortega

    [email protected]

  • ESTADSTICA BSICA APLICADA CON SPPS 6

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 7

    Captulo 1

    Introduccin al SPSS 1.1. Introduccin Una de las caractersticas ms destacadas de SPSS (en especial con respecto a BMDP o SAS) es que no es necesario conocer un lenguaje de programacin para utilizarlo (aunque lo tiene). Su exitosa presentacin de Mtodos Estadsticos a ejecutar en forma de persianas, permite comenzar a utilizarlo casi sin conocimientos previos del paquete. Por esta razn, este texto ser simple y breve ya que, sin duda, la mejor manera de aprende a manejar SPSS es utilizarlo.

    1.2. El editor de datos Lo primero que analizaremos es cmo introducir los datos de nuestro problema, definiendo las variables a analizar con posterioridad. Al abrir el paquete SPSS nos aparece un cuadro como el de la Figura 1.1, en el que, si queremos ir tecleando los datos, elegiremos la opcin Introducir datos, apareciendo, a continuacin el editor de datos en blanco en el que debemos introducir los datos observados en el primer individuo de la primera variable en la primera fila de la primera columna. Para ir viendo cmo funciona el editor de datos, vamos a considerar un ejemplo

    Ejemplo 1.1 _____________________________________________ Se eligi al azar una muestra de 56 individuos de una poblacin a los que se clasific segn su Edad, su Sexo y segn si era o no Fumador, obtenindose los siguientes datos:

  • ESTADSTICA BSICA APLICADA CON SPPS 8

    Menores de 20 aos Hombre Mujer S fuma 11 3 No fuma 1 7 Entre 20 y 50 aos Hombre Mujer S fuma 1 4 No fuma 2 5 Mayores de 50 aos Hombre Mujer S fuma 13 1 No fuma 2 6 En determinados modelos, las variables deben ser categricas; es decir, deben definir categoras en las que clasificar los datos. Nosotros, de momento, utilizaremos datos de tipo numrico. Para ello, lo ms simple es ir introduciendo los datos y ms tarde, modificar, si es necesario, sus propiedades.

    Figura 1.1 Para el ejemplo en cuestin, incluiremos (por este orden) datos de las tres variables: la variable Edad, con tres valores, 1 para los individuos menores de 20 aos, 2 para los individuos entre 20 y 50 aos y 3 para los individuos mayores de 50 aos. Para la variable Sexo, dos valores, 0 para los hombres y 1 para las mujeres. Y, finalmente, la variable Fumador, con dos valores, 0 para los individuos que no fuman y 1 para los que s fuman. As, los datos de los individuos de la tabla anterior sern los de la Figura 1.2.

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 9

    Figura 1.2 Con objeto de introducir el nombre de las variables, pincharemos con el Ratn la pestaa de abajo Vista de variables, apareciendo un panel como el de la Figura 1.3. Pinchando el 1, podremos teclear el nombre de las tres variables as como sus principales caractersticas. Volveremos al editor de datos pinchando en la pestaa inferior, Vista de datos.

    Figura 1.3

    En la barra de arriba (en Archivo) deberemos salvar nuestro fichero de datos. Si nuestros datos estn ya en un archivo, debemos incluirlos en el Editor de datos con la opcin: Archivo Abrir Datos (Figura 1.4)

  • ESTADSTICA BSICA APLICADA CON SPPS 10

    Figura 1.4

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 11

    Captulo 2

    Estadstica Descriptiva 2.1. Distribuciones de Frecuencias, Representaciones Grficas, Medidas de Posicin y Dispersin El estudio de las tcnicas estudiadas aqu, puede seguirse en el Captulo 2 del texto CB. Una de las ventajas de SPSS es que, de una vez, obtenemos la mayora de los resultados en los que estamos interesados.

    Ejemplo 2.1-CB ___________________________________________ Despus de introducir los datos, ejecutamos la secuencia

    Analizar Estadsticos Descriptivos Frecuencias

    Figura 2.1

  • ESTADSTICA BSICA APLICADA CON SPPS 12

    aparecindonos una ventana de dilogo como la de la Figura 2.2

    Figura 2.2

    Ahora, pasamos la variable en estudio, nivel, al cuadro de la derecha, completamos lo estadsticos que queremos calcule en el botn Estadsticos, que en nuestro caso hemos elegido segn la Figura 2.3

    Figura 2.3 cerrando la ventana con el botn Continuar. Lo mismo hacemos con el botn Grficos, con el que, en este caso, hemos elegido las opciones que aparecen en la Figura 2.4,

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 13

    Figura 2.4

    Ya podemos ejecutar nuestras elecciones efectuadas con las anteriores ventanas de dilogo, presionando el botn Aceptar. No obstante, queremos sealar que, todo lo que hemos ido seleccionando, se ha ido traduciendo al lenguaje SPSS dentro de lo que aparece en el botn Pegar, que si lo presionamos aparecer, en este ejemplo, FREQUENCIES VARIABLES=nivel /NTILES= 4 /STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM MEAN MEDIAN MODE SKEWNESS SESKEW KURTOSIS SEKURT /HISTOGRAM NORMAL /ORDER= ANALYSIS .

    sta es la denominada Sintaxis SPSS o Lenguaje de Programacin SPSS, que podemos salvar, guardar, modificar y ejecutar en lugar de utilizar las persianas que aparecen arriba del Editor de Datos. No obstante, como precisamente stas son la ventaja de SPSS, no utilizaremos la sintaxis de este paquete sino dichas persianas, pero queremos que el lector tenga presente siempre la existencia subyacente de estos programas. O bien mediante los mens o bien con la sintaxis, para este ejemplo obtendramos los siguientes resultados:

  • ESTADSTICA BSICA APLICADA CON SPPS 14

    Estadsticos

    nivel

    N Vlidos 34

    Perdidos 0

    Media 11,3529

    Mediana 11,4500

    Moda 12,50

    Desv. tp. 1,87459

    Varianza 3,514

    Asimetra ,536

    Error tp. de asimetra ,403

    Curtosis ,876

    Error tp. de curtosis ,788

    Rango 8,70

    Mnimo 7,80

    Mximo 16,50

    Percentiles 25 10,0500

    50 11,4500

    75 12,4000

    nivel

    Frecuencia Porcentaje Porcentaje

    vlido Porcentaje acumulado

    Vlidos 7,80 1 2,9 2,9 2,9

    8,50 1 2,9 2,9 5,9

    8,60 1 2,9 2,9 8,8

    9,10 1 2,9 2,9 11,8

    9,20 1 2,9 2,9 14,7

    9,30 1 2,9 2,9 17,6

    9,70 1 2,9 2,9 20,6

    9,90 1 2,9 2,9 23,5

    10,10 1 2,9 2,9 26,5

    10,20 1 2,9 2,9 29,4

    10,30 1 2,9 2,9 32,4

    10,60 1 2,9 2,9 35,3

    10,80 1 2,9 2,9 38,2

    11,10 2 5,9 5,9 44,1

    11,30 1 2,9 2,9 47,1

    11,40 1 2,9 2,9 50,0

    11,50 1 2,9 2,9 52,9

    11,60 1 2,9 2,9 55,9

    11,80 1 2,9 2,9 58,8

    11,90 1 2,9 2,9 61,8

    12,00 1 2,9 2,9 64,7

    12,20 1 2,9 2,9 67,6

    12,30 2 5,9 5,9 73,5

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 15

    12,40 2 5,9 5,9 79,4

    12,50 3 8,8 8,8 88,2

    12,70 1 2,9 2,9 91,2

    14,90 1 2,9 2,9 94,1

    15,00 1 2,9 2,9 97,1

    16,50 1 2,9 2,9 100,0

    Total 34 100,0 100,0

    18,0016,0014,0012,0010,008,00

    nivel

    8

    6

    4

    2

    0

    Fre

    cu

    en

    cia

    Media =11,3529

    Desviacin tpica =1,

    87459

    N =34

    Histograma

    El histograma final se puede editar y cambiar los colores, el ttulo, etc. Con la secuencia

    Grficos Histograma

    podemos volver a obtener el histograma anterior, pero lo que queremos sealar es que la persiana de Grficos, permite obtener grficos de ata calidad sin tener que realizar anlisis estadstico alguno.

  • ESTADSTICA BSICA APLICADA CON SPPS 16

    Figura 2.5

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 17

    Captulo 3

    Intervalos y Contrastes bsicos 3.1. Intervalos y tests t-Student SPSS calcula, bsicamente, intervalos y tests de la t de Student. Aunque en CB resolvimos este ejemplo con un intervalo basado en la normal, lo ejecutaremos a continuacin con uno basado en la t de Student. Dado que se consideran 35 observaciones, las diferencias apenas si existe entre ambas metodologas.

    Ejemplo 6.2-CB ___________________________________________ Despus de introducir los datos, ejecutamos la secuencia

    Analizar Comparar medias Prueba T para una muestra

    Figura 3.1

  • ESTADSTICA BSICA APLICADA CON SPPS 18

    A continuacin aparece (Figura 3.2) el siguiente cuadro de dilogo en donde hemos trasladado la variable en estudio al cuadro de la derecha. El 0 de la ventana Valor de Prueba es la hiptesis nula a contrastar. Con el botn Opciones podemos solicitar el intervalo de confianza para el coeficiente de confianza deseado.

    Figura 3.2 El resultado obtenido es el siguiente: Estadsticos para una muestra

    N Media Desviacin

    tp. Error tp. de

    la media

    Actividad 35 ,75300 ,518283 ,087606

    Prueba para una muestra

    Valor de prueba = 0

    t gl Sig. (bilateral) Diferencia de medias

    95% Intervalo de confianza para la

    diferencia

    Inferior Superior

    Actividad 8,595 34 ,000 ,753000 ,57496 ,93104

    Al final del segundo cuadro vemos el intervalo de confianza de confianza 095.

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 19

    Captulo 4

    Anlisis de la Varianza 4.1. Un Factor: Diseo Completamente Aleatorizado El estudio del test analizado aqu, puede estudiar en la Seccin 8.2 del texto CB.

    Ejemplo 8.1-CB ___________________________________________ Despus de introducir los datos, primero vamos a visualizar los datos dibujando un Diagrama de Cajas mediante la secuencia (Figura 4.1)

    Grficos Diagramas de Cajas

    Figura 4.1 con lo que se abre la ventana de dilogo de la Figura 4.2

  • ESTADSTICA BSICA APLICADA CON SPPS 20

    Figura 4.2

    en la que seleccionamos definir, hacindolo segn la Figura 4.3

    Figura 4.3 Ahora, con el botn Aceptar obtenemos los siguientes resultados,

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 21

    dieta Resumen del procesamiento de los casos

    dieta

    Casos

    Vlidos Perdidos Total

    N Porcentaje N Porcentaje N Porcentaje

    peso 1 5 100,0% 0 ,0% 5 100,0%

    2 5 100,0% 0 ,0% 5 100,0%

    3 5 100,0% 0 ,0% 5 100,0%

    peso

    321

    dieta

    36,00

    33,00

    30,00

    pe

    so

    en donde destaca el ltimo grfico, el Diagrama de Cajas buscado, en donde se puede apreciar que puede aceptarse una dispersin parecida en los tres tratamientos del factor dieta.

  • ESTADSTICA BSICA APLICADA CON SPPS 22

    El Anlisis de la Varianza para un factor puede hacerse ahora con la secuencia

    Analizar Comparar medias ANOVA de un factor

    pero preferimos seguir la secuencia (Figura 4.4)

    Analizar Modelo lineal general Univariante

    por ser este anlisis el ms simple de Modelo Lineal General

    Figura 4.4 La ventana de dilogo que aparece a continuacin se completa como se indica

    Figura 4.5

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 23

    en la Figura 4.5. Con el botn Aceptar obtendramos ahora los siguientes resultados Factores inter-sujetos

    N

    dieta 1 5

    2 5

    3 5

    Pruebas de los efectos inter-sujetos

    Variable dependiente: peso

    Fuente

    Suma de cuadrados

    tipo III gl Media

    cuadrtica F Significacin

    Modelo corregido 20,133(a) 2 10,067 1,144 ,351

    Interseccin 16800,267 1 16800,267 1909,121 ,000

    dieta 20,133 2 10,067 1,144 ,351

    Error 105,600 12 8,800

    Total 16926,000 15

    Total corregida 125,733 14

    a R cuadrado = ,160 (R cuadrado corregida = ,020)

    de donde destaca el ltimo cuadro que es la tabla de Anlisis de la Varianza

    Ejemplo 8.2-CB ___________________________________________ Despus de introducir los datos y de ver con un diagrama de cajas que puede admitirse la hiptesis de homocedasticidad, correramos un Anlisis de la Varianza como antes, obteniendo la tabla final Pruebas de los efectos inter-sujetos

    Variable dependiente: insulina

    Fuente

    Suma de cuadrados

    tipo III gl Media

    cuadrtica F Significacin

    Modelo corregido 154,920(a) 4 38,730 29,755 ,000

    Interseccin 957,071 1 957,071 735,281 ,000

    estimula 154,920 4 38,730 29,755 ,000

    Error 45,557 35 1,302

    Total 1157,548 40

    Total corregida 200,477 39

    a R cuadrado = ,773 (R cuadrado corregida = ,747)

  • ESTADSTICA BSICA APLICADA CON SPPS 24

    que indica rechazar la hiptesis nula de igualdad de los efectos medios de los cinco estimulantes. Para ejecutar test de comparaciones mltiples elegimos el botn Post hoc y completamos el cuadro de dilogo con varios de estos tests, una vez trasladada la variable en estudio al cuadro de la derecha (Figura 4.6)

    Figura 4.6

    Los resultados as obtenidos (adems de la tabla ANOVA anterior) aparecen a continuacin,

    Pruebas post hoc

    estimula Comparaciones mltiples

    Variable dependiente: insulina

    (I) estimula (J) estimula

    Diferencia entre medias

    (I-J) Error tp. Significacin

    Intervalo de confianza al 95%.

    Lmite inferior Lmite

    superior

    DHS de Tukey 1 2 -,0263 ,57045 1,000 -1,6663 1,6138 3 -2,2800(*) ,57045 ,003 -3,9201 -,6399

    4 -4,3900(*) ,57045 ,000 -6,0301 -2,7499

    5 -4,4363(*) ,57045 ,000 -6,0763 -2,7962

    2 1 ,0263 ,57045 1,000 -1,6138 1,6663

    3 -2,2538(*) ,57045 ,003 -3,8938 -,6137

    4 -4,3638(*) ,57045 ,000 -6,0038 -2,7237 5 -4,4100(*) ,57045 ,000 -6,0501 -2,7699

    3 1 2,2800(*) ,57045 ,003 ,6399 3,9201

    2 2,2538(*) ,57045 ,003 ,6137 3,8938

    4 -2,1100(*) ,57045 ,006 -3,7501 -,4699

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 25

    5 -2,1563(*) ,57045 ,005 -3,7963 -,5162

    4 1 4,3900(*) ,57045 ,000 2,7499 6,0301 2 4,3638(*) ,57045 ,000 2,7237 6,0038

    3 2,1100(*) ,57045 ,006 ,4699 3,7501

    5 -,0463 ,57045 1,000 -1,6863 1,5938

    5 1 4,4363(*) ,57045 ,000 2,7962 6,0763

    2 4,4100(*) ,57045 ,000 2,7699 6,0501

    3 2,1563(*) ,57045 ,005 ,5162 3,7963 4 ,0463 ,57045 1,000 -1,5938 1,6863

    Scheffe 1 2 -,0263 ,57045 1,000 -1,8805 1,8280

    3 -2,2800(*) ,57045 ,009 -4,1342 -,4258

    4 -4,3900(*) ,57045 ,000 -6,2442 -2,5358

    5 -4,4363(*) ,57045 ,000 -6,2905 -2,5820

    2 1 ,0263 ,57045 1,000 -1,8280 1,8805 3 -2,2538(*) ,57045 ,010 -4,1080 -,3995 4 -4,3638(*) ,57045 ,000 -6,2180 -2,5095

    5 -4,4100(*) ,57045 ,000 -6,2642 -2,5558

    3 1 2,2800(*) ,57045 ,009 ,4258 4,1342

    2 2,2538(*) ,57045 ,010 ,3995 4,1080

    4 -2,1100(*) ,57045 ,018 -3,9642 -,2558

    5 -2,1563(*) ,57045 ,015 -4,0105 -,3020 4 1 4,3900(*) ,57045 ,000 2,5358 6,2442

    2 4,3638(*) ,57045 ,000 2,5095 6,2180

    3 2,1100(*) ,57045 ,018 ,2558 3,9642

    5 -,0463 ,57045 1,000 -1,9005 1,8080

    5 1 4,4363(*) ,57045 ,000 2,5820 6,2905

    2 4,4100(*) ,57045 ,000 2,5558 6,2642 3 2,1563(*) ,57045 ,015 ,3020 4,0105

    4 ,0463 ,57045 1,000 -1,8080 1,9005

    Basado en las medias observadas. * La diferencia de medias es significativa al nivel ,05.

    Subconjuntos homogneos insulina

    estimula N

    Subconjunto

    1 2 3

    DHS de Tukey(a,b)

    1 8 2,6650

    2 8 2,6913

    3 8 4,9450

    4 8 7,0550

    5 8 7,1013

    Significacin 1,000 1,000 1,000

    Scheffe(a,b)

    1 8 2,6650

    2 8 2,6913

    3 8 4,9450

    4 8 7,0550

    5 8 7,1013

    Significacin 1,000 1,000 1,000

    Se muestran las medias para los grupos en subconjuntos homogneos.

  • ESTADSTICA BSICA APLICADA CON SPPS 26

    Basado en la suma de cuadrados tipo III El trmino error es la Media cuadrtica (Error) = 1,302. a Usa el tamao muestral de la media armnica = 8,000 b Alfa = ,05.

    observndose en la ltima tabla los mismos grupos de tratamientos homognenos obtenidos en el texto CB.

    4.2. Un Factor: Diseo por Bloques Aleatorizados El estudio del test analizado aqu, puede estudiar en la Seccin 8.3 del texto CB.

    Ejemplo 8.3-CB ___________________________________________ Despus de introducir los datos, obtenemos la tabla de Anlisis de la Varianza ejecutando la secuencia (Figura 4.7)

    Analizar Modelo lineal general Univariante

    Figura 4.7 para completar luego el cuadro de dilogo como se indica en la Figura 4.8

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 27

    Figura 4.8

    Ahora con el botn Modelo elegimos la opcin Personalizado y, pasando las variables a la ventana de la derecha, la opcin de Efectos principales, ya que en el diseo por bloques no consideramos la posibilidad de interaccin entre las variables. Con los botones Continuar y Aceptar obtenemos los siguientes resultados, Factores inter-sujetos

    N

    Vitamina 1 4

    2 4

    3 4

    Raza 1 3

    2 3

    3 3

    4 3

    Pruebas de los efectos inter-sujetos

    Variable dependiente: Peso

    Fuente

    Suma de cuadrados

    tipo III gl Media

    cuadrtica F Significacin

    Modelo corregido 165,000(a) 5 33,000 3,062 ,103

    Interseccin 94696,333 1 94696,333 8786,258 ,000

    Vitamina 84,667 2 42,333 3,928 ,081

    Raza 80,333 3 26,778 2,485 ,158

    Error 64,667 6 10,778

    Total 94926,000 12

  • ESTADSTICA BSICA APLICADA CON SPPS 28

    Total corregida 229,667 11

    a R cuadrado = ,718 (R cuadrado corregida = ,484)

    en donde la ltima tabla es la de Anlisis de la Varianza obtenida en CB.

    4.3. Dos Factores: Diseo Completamente Aleatorizado El estudio del test analizado aqu, puede estudiar en la Seccin 8.5 del texto CB.

    Ejemplo 8.5-CB ___________________________________________ Despus de introducir los datos, obtenemos la tabla de Anlisis de la Varianza ejecutando la secuencia

    Analizar Modelo lineal general Univariante y completando despus la ventana de dilogo como se indica en la Figura 4.9

    Figura 4.9 Hay muchas semejanzas con el caso anterior del diseo por bloques pero ahora s se admite la interaccin entre variables, por lo que no hace falta modificar el modelo; ahora lo requerimos completo. Por eso, presionando ya el botn Aceptar, obtenemos los siguientes resultados, en donde la ltima tabla es la misma de ANOVA obtenida en CB

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 29

    Factores inter-sujetos

    N

    Estacin 1 12

    2 12

    3 12

    4 12

    Frmaco 1 16

    2 16

    3 16

    Pruebas de los efectos inter-sujetos

    Variable dependiente: Alergia

    Fuente

    Suma de cuadrados

    tipo III gl Media

    cuadrtica F Significacin

    Modelo corregido 10488,167(a) 11 953,470 44,781 ,000

    Interseccin 93633,333 1 93633,333 4397,652 ,000

    Estacin 4132,167 3 1377,389 64,691 ,000

    Frmaco 6017,167 2 3008,583 141,303 ,000

    Estacin * Frmaco 338,833 6 56,472 2,652 ,031

    Error 766,500 36 21,292

    Total 104888,000 48

    Total corregida 11254,667 47

    a R cuadrado = ,932 (R cuadrado corregida = ,911)

  • ESTADSTICA BSICA APLICADA CON SPPS 30

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 31

    Captulo 5

    Regresin Lineal y Correlacin 5.1. Regresin Lineal Simple El estudio del test analizado aqu, puede estudiar en las Secciones 9.2 y 9.3 del texto CB. Como all destacbamos, hay dos aspectos de inters: la representacin grfica de los datos y el Anlisis de la Regresin

    Ejemplo 9.1-CB ___________________________________________ Despus de introducir los datos, primero vamos a visualizar los datos dibujando un Diagrama de Dispersin mediante la secuencia (Figura 5.1)

    Grficos Interactivos Diagrama de dispersin

    Figura 5.1

  • ESTADSTICA BSICA APLICADA CON SPPS 32

    La cantidad de oxgeno se pasa a la dependiente y la profundidad a la independiente, obtenindose el siguiente grfico en donde puede verse tambin la correlacin entre ambas variables.

    Regresin lineal

    20,00 30,00 40,00 50,00 60,00 70,00

    profund

    0,00

    2,00

    4,00

    6,00

    co

    nt_

    ox

    i

    1cont_oxi = 8,63 + -0,11 * profund

    R-cuadrado = 0,80

    La segunda cuestin importante es contrastar, mediante la tabla de Anlisis de la Varianza para la Regresin Lineal, si puede admitirse la hiptesis nula de que la variable independiente no es significativa a la hora de predecir a la variable dependiente. Para ello ejecutamos la secuencia

    Analizar Regresin Lineal

    completando la ventana de dilogo que aparece como se indica en la Figura 5.2, en donde. A dems de indicar cul es la variable independiente y dependiente, hemos seleccionado el Mtodo Hacia atrs. El resto de las opciones, como la de que nos d los estimadores o el nivel de significacin del test de la F de Snedecor de la tabla de Anlisis de la Varianza para la Regresin Lineal, ya vienen dadas por defecto.

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 33

    Figura 5.2 Los resultados as obtenidos son los siguientes, en donde de nuevo destaca la penltima tabla ANOVA y las estimaciones de los coeficientes de regresin de la ltima tabla.

    Regresin Variables introducidas/eliminadas(b)

    Modelo Variables

    introducidas Variables

    eliminadas Mtodo

    1 profund(a) . Introducir

    a Todas las variables solicitadas introducidas b Variable dependiente: cont_oxi

    Resumen del modelo

    Modelo R R cuadrado R cuadrado corregida

    Error tp. de la estimacin

    1 ,896(a) ,803 ,763 1,20444

    a Variables predictoras: (Constante), profund

    ANOVA(b)

    Modelo Suma de

    cuadrados gl Media

    cuadrtica F Sig.

    1 Regresin 29,481 1 29,481 20,322 ,006(a)

    Residual 7,253 5 1,451

    Total 36,734 6

    a Variables predictoras: (Constante), profund

  • ESTADSTICA BSICA APLICADA CON SPPS 34

    b Variable dependiente: cont_oxi Coeficientes(a)

    Modelo

    Coeficientes no estandarizados

    Coeficientes estandarizado

    s

    t Sig. B Error tp. Beta

    1 (Constante) 8,631 1,077 8,010 ,000

    profund -,108 ,024 -,896 -4,508 ,006

    a Variable dependiente: cont_oxi

    5.2. Regresin Lineal Mltiple El estudio del test analizado aqu, puede estudiar en las Secciones 10.2 y 10.3 del texto CB. Las opciones a ejecutar son las mismas que en la seccin anterior, con la diferencia de que debemos incluir ms de una variable independiente.

    Ejemplo 10.1-CB __________________________________________ Despus de introducir los datos, ejecutamos

    Regresin Lineal completando el cuadro de dilogo como se indica en la Figura 5.3

    Figura 5.3 Las tres ltimas tablas que as se obtienen,

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 35

    ANOVA(c)

    Modelo Suma de

    cuadrados gl Media

    cuadrtica F Sig.

    1 Regresin 2502,390 2 1251,195 34,081 ,000(a)

    Residual 440,543 12 36,712

    Total 2942,933 14

    2 Regresin 2502,373 1 2502,373 73,840 ,000(b)

    Residual 440,561 13 33,889

    Total 2942,933 14

    a Variables predictoras: (Constante), X2, X1 b Variables predictoras: (Constante), X2 c Variable dependiente: Y

    Coeficientes(a)

    Modelo

    Coeficientes no estandarizados

    Coeficientes estandarizado

    s

    t Sig. B Error tp. Beta

    1 (Constante) 2,086 6,739 ,309 ,762

    X1 ,057 2,613 ,006 ,022 ,983

    X2 1,050 ,326 ,916 3,219 ,007

    2 (Constante) 1,977 4,373 ,452 ,659

    X2 1,057 ,123 ,922 8,593 ,000 a Variable dependiente: Y

    Variables excluidas(b)

    Modelo Beta dentro t Sig. Correlacin

    parcial

    Estadsticos de colinealidad

    Tolerancia

    2 X1 ,006(a) ,022 ,983 ,006 ,154

    a Variables predictoras en el modelo: (Constante), X2 b Variable dependiente: Y

    indican considerar a X2 como nica covariable independiente significativa y concluir con la recta ajustada

    Y = 1977 + 1057 X2

  • ESTADSTICA BSICA APLICADA CON SPPS 36

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 37

    Captulo 6

    Tablas de Contingencia 6.1. Contraste de homogeneidad de varias muestras El estudio del test analizado aqu, puede estudiar en la Seccin 12.3 del texto CB.

    Ejemplo 12.8-CB __________________________________________ Despus de introducir los datos, ejecutamos la secuencia (Figura 6.1)

    Datos Ponderar casos

    Figura 6.1

  • ESTADSTICA BSICA APLICADA CON SPPS 38

    y, en el cuadro de dilogo resultante, ponderamos los datos con la variable frecu (Figura 6.2)

    Figura 6.2

    Ahora ya podemos realizar el Anlisis de la tabla de contingencia ejecutando la secuencia (Figura 6.3)

    Analizar Estadsticos descriptivos Tablas de contingencia

    Figura 6.3 Ahora debemos completar el cuadro de dilogo que se abre, teniendo en cuenta cul variable forma las filas y cul las columnas. Adems, con el botn Estadsticos, le pedimos el Chi-cuadrado de Pearson, que es el utilizado en CB (Figura 6.4)

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 39

    Figura 6.4

    Por ltimo, en el botn Casillas le podemos pedir no slo las frecuencias observadas sino las esperadas de cada casilla. (Figura 6.5)

    Figura 6.5 Los resultados as obtenidos son los siguientes:

  • ESTADSTICA BSICA APLICADA CON SPPS 40

    Tablas de contingencia Resumen del procesamiento de los casos

    Casos

    Vlidos Perdidos Total

    N Porcentaje N Porcentaje N Porcentaje

    Comunidad * Fumador 300 100,0% 0 ,0% 300 100,0%

    Tabla de contingencia Comunidad * Fumador

    Fumador

    Total 1 2

    Comunidad 1 Recuento 13 87 100

    Frecuencia esperada 16,0 84,0 100,0

    2 Recuento 17 83 100

    Frecuencia esperada 16,0 84,0 100,0

    3 Recuento 18 82 100

    Frecuencia esperada 16,0 84,0 100,0

    Total Recuento 48 252 300

    Frecuencia esperada 48,0 252,0 300,0

    Pruebas de chi-cuadrado

    a 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 16,00.

    destacando la ltima tabla en la que aparece el valor del estadstico chi-cuadrado de Pearson, 1042 y el p-valor del test, 0594, los mismos valores que en CB.

    6.2. Contraste de independencia de caracteres El estudio del test analizado aqu, puede estudiar en la Seccin 12.4 del texto CB. El anlisis con SPSS es idntico al de la seccin anterior.

    Ejemplo 12.9-CB __________________________________________ Despus de introducir los datos, ejecutamos la secuencia (Figura 6.6)

    Valor gl Sig. asinttica

    (bilateral)

    Chi-cuadrado de Pearson 1,042(a) 2 ,594

    Razn de verosimilitudes 1,069 2 ,586 Asociacin lineal por lineal ,927 1 ,336

    N de casos vlidos 300

  • ALFONSO GARCA PREZ y

    MARA YOLANDA CABRERO ORTEGA 41

    Datos Ponderar casos

    Figura 6.6 ponderndolos en este caso con la variable frecuen. Ahora ya podemos ejecutar el Anlisis de la tabla de contingencia ejecutando la secuencia (Figura 6.7)

    Analizar Estadsticos descriptivos Tablas de contingencia

    Figura 6.7

  • ESTADSTICA BSICA APLICADA CON SPPS 42

    sin olvidar completar, como antes, los botones Estadsticos y Celdas. Los resultados as obtenidos son los siguientes:

    Tablas de contingencia Resumen del procesamiento de los casos

    Casos

    Vlidos Perdidos Total

    N Porcentaje N Porcentaje N Porcentaje

    deterior * depresio 100 100,0% 0 ,0% 100 100,0%

    Tabla de contingencia deterior * depresio

    depresio

    Total ,00 1,00

    deterior ,00 Recuento 22 31 53

    Frecuencia esperada 16,4 36,6 53,0

    1,00 Recuento 9 38 47

    Frecuencia esperada 14,6 32,4 47,0

    Total Recuento 31 69 100

    Frecuencia esperada 31,0 69,0 100,0

    Pruebas de chi-cuadrado

    Valor gl Sig. asinttica

    (bilateral) Sig. exacta (bilateral)

    Sig. exacta (unilateral)

    Chi-cuadrado de Pearson 5,823(b) 1 ,016

    Correccin por continuidad(a) 4,824 1 ,028

    Razn de verosimilitudes 5,975 1 ,015

    Estadstico exacto de Fisher ,018 ,013

    Asociacin lineal por lineal 5,764 1 ,016

    N de casos vlidos 100

    a Calculado slo para una tabla de 2x2. b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 14,57.

    observando en la ltima tabla los valores del estadstico de Pearson, 5823 y el p-valor del test asociado, 0016, los mismos que los obtenidos en CB.